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(57) Abstract 

The invention concerns a novel nucleic sequence and deduced protein sequence family with whole or partial human endogenous 
retroviral motifs. The invention also concerns the detection and/or the use of said nucleic sequences and said corresponding protein 
sequences or fragments of said sequences, for diagnostic, prophylactic and therapeutic uses, in particular for neuropathological conditions 
with autoimmune constituent such as multiple sclerosis. Said purified nucleic acid sequences comprise all or part of a sequence coding for 
a human endogenous retroviral sequence having at least env-type retroviral motifs, corresponding to the sequence SEQ ID NO: 1 or to a 
sequence having a homology level with said sequence SEQ ID NO:l not less than 80 % on more than 190 nucleotides or not less than 70 
% on more than 600 nucleotides for env-typs domains. The invention further concerns the use of the flanking or adjacent sequences of 
said sequences and controlled by the latter, as diagnostic reagents. 

(57) Abrtfge' 

Nouvelle famille de sequences nucl6iques et de sequences protelques d6duites, qui pnfsentent des motifs rdtroviraux endogdnes 
humains complets ou partiels. D6tection et/ou utilisation desdites sequences nucldiques et desdites sequences proteiques correspondantes 
ou de fragments de ces sequences, dans le cadre d* applications diagnostiques, prophylactiques et thdrapeutiques, en particulier pour des 
neuropathologies a composante autoimmune comme la sclerose en plaques. Lesdites sequences d'acide nucldique purifi6 comprennent tout 
ou partie d'une sequence codant pour une sequence rdtrovirale endogine humaine, qui prdsente au moins des motifs rdtroviraux de type 
env, repondant a la sequence SEQ ID NO: 1 ou a une sequence prdsentant un niveau d'homologie avec ladite sequence SEQ ID NO: 1 
supdrieur ou egal a 80 % sur plus de 190 nucleotides ou supeneur ou dgal a 70 % sur plus de 600 nucleotides pour les domaines de type 
env. Utilisation des sequences flanquantes ou adjacentes desdites sequences et contrdlees par ces demieres, comme reactifs de diagnostic. 
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FAMILLE DE SEQUENCES NUCLEIQUES ET DE SEQUENCES PROTEIQUES DEDUITES PRESENT ANT DES MOTIFS 
RETROVIRAUX ENDOGENES HUMAINS, ET LEURS APPLICATIONS 



5 La presente invention est relative a une nouvelle famille de 

sequences nucleiques et de sequences proteiques deduites. qui presentent des motifs 
retroviraux endogenes humains complets ou paniels. ainsi que des sequences 
flanquantes ou adjacentes desdites sequences, et controlees par ces dernieres : modifi- 
cation de T expression ou alteration de la structure (polyadenylation. epissage aiter- 

1 0 natif. . . ) desdites sequences flanquantes. 

L'invention est egalement relative a la detection et/ou a l'utilisation 
desdites sequences nucleiques et desdites sequences proteiques correspondantes. dans 
le cadre duplications diagnostiques, prophylactiques et therapeutiques, en paniculier 
pour des neuropathologies a composante autoimmune comme la sclerose en plaques. 

15 L'invention conceme aussi Tobtention de sondes nucleiques double 

brins et simple brin anti-sens, de ribozymes, aptes a moduler la replication virale (T.R. 
Cech, Science, 1987, 236, 1532-1539 ; R.H. Symons. Trends Biochem. ScL, 1989, 14, 
445-450) des molecules recombinantes correspondantes, et des anticorps associes. 

Les retrovirus sont des virus qui se repliquent uniquement en utili- 

20 sant la voie inverse du traitement classique de rinformation genetique. Ce processus, 
nomme transcription inverse, est medie par une ADN polymerase ARN dependante ou 
transcriptase reverse, codee par le gene pol. Les retrovirus codent aussi au minimum 
pour deux genes additionnels. Le gene gag code pour les proteines du squelette. ma- 
trice, nucleocapside et capside. Le gene em code pour les glycoproteins d'enveloppe. 

25 La transcription retro virale est regulee par des regions promotrices ou ;i enhancers '\ 
situees dans des regions hautement repetees ou LTR {Long Terminal Repeat) et qui 
sont presentes aux deux extremites du genome retroviral. 

Lors de Tinfection d'une cellule, la polymerase fait une copie ADN 
du genome ARN ; cette copie peut alors s'integrer dans le genome humain. Les retro- 

30 virus ne tuent pas les cellules qu'ils infectent, mais au contraire ameliorent souvent 
leur rapidite de croissance. Les retrovirus peuvent infecter des cellules germinales ou 
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des embryons a un stade precoce ; ils peuvent dans ces conditions, integrer la lignee 
germinale et etre transmis par transmission mendelienne venicalc. ce qui constitue la 
relation la plus etroite entre un hote et son parasite. Ces virus endogenes peuvent 
degenerer au cours des generations de I'organisme hote et perdre leurs proprietes ini- 

5 tiales. Cependant certains d'entre eux peuvent conserver tout ou partie de leurs pro- 
prietes ou des proprietes des motifs les composant. ou encore acquerir de nouvelles 
proprietes fonctionnelles presentant un avantage pour I'organisme hote. ce qui expli- 
querait la preservation de leur sequence. 

V existence de motifs endogenes presentant de longs cadres de 

10 lecture ouverts et/ou soumis a une forte pression de selection peut done etre indicatrice 
d'une fonction biologique preservee ou acquise, qui peut correspondre a un benefice 
pour Torganisme hote. Ces sequences retrovirales peuvent aussi subir, au cours des 
generations, des modifications discretes qui vont etre a meme de reveiller certaines de 
leurs potentiates et engendrer ou favoriser des processus pathologiques. II est apparu 

15 recemment necessaire de faire le bilan et d' identifier ces sequences aftn de pouvoir 
evaluer leur impact fonctionnel. 

Les sequences retrovirales endogenes humaines ou HERVs repre- 
sentent une part importante du genome humain. Ces regions retrovirales se presentent 
sous plusieurs formes : 

20 - des structures retrovirales endogenes completes associant des 

motifs gag, pol et env, flanques de sequences nucleiques repetees, qui montrent une 
analogie significative avec la structure ITR-gag-pol-env-lTR des retrovirus infec- 
tieux, 

- des sequences retrovirales tronquees ; par exemple, les retro- 
25 transposons sont prives de leur domaine env et les retroposons ne possedent pas les 

regions env et LTR. 

Jusqu'a present Tetude de ces regions du genome a ete negligee chez 

1' Homme pour deux raisons essentielles : 

- 1'existence d' insertions/deletions qui peuvent decaler le cadre de 
30 lecture et de mutations qui modifient la sequence. Ces modifications entrainent des 

alterations de la structure et par consequent de la fonction biologique de ces motifs. 
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- l'absence dissociations averees avec des pathologies humaines. 

La connaissance. recente de fragments significativement representa- 
tifs du genome humain et une orientation des recherches vers une etude struc- 
ture/fonction des motifs retroviral endogenes. ont permis de preciser l interet de ces 
5 regions. L' implication de sequences endogenes tronquees ou completes dans des 
pathologies chez Tanimal est document* ; par exemple leur association avec des 
processus tumoraux a ete clatrement mise en evidence (S.K. Chattopadhyay et coll.. 
1982. Nature, 295, 25-31). Une recherche visant a preciser ['association ou Tinfluence 
des HERVs dans des pathologies humaines se justifie done aujourd'hui. 
! o Une classification des elements HERV a ete proposee (Tonjes R.R. 

et al.. AIDS & Hum. Retroviral., 1996, 13, S261-S267; A.M. Krieg et al.. FASEB J.. 
1992. 6, 2537-2544). Elle est basee sur une homologie de ces sequences avec des 
retrovirus isoles chez les animaux, a l'aide de sondes retroviral heterologues. En 
effet, en general, les HERVs presented relativement peu d'homologie avec des retro- 

1 5 virus infectieux humains connus. 

Les families de classe I presentent une homologie de sequence avec 
les retrovirus de mammiferes de type C ; on peut citer notamment la superfamille ERI, 
proche du virus MuLV {murine leukemia virus) et du virus BaEV (baboon endoge- 
nous virus). 

20 Les families de classe II presentent une homologie de sequence avec 

les retrovirus de mammiferes de type B tel que le MMTV (mouse mammary tumour 
virus) ou les retrovirus de type D tel que le SRV (squirrel monkey retrovirus). 

D'autres families ont egalement ete decrites ; parmi celles-ci, on peut 
citer des HERVs qui presentent, de maniere exceptionnelle, une homologie partielle 
25 avec HTLV-1 (RTVL-H) ou des virus de primates ; HRES-1, par exemple, presente 
une homologie de sequence avec des HTLVs. 

Les programmes de tres grand sequencage du genome humain per- 
mettent aujourd'hui de disposer d'un nombre sigmficatif de nouvelles sequences retro- 
virales. L'usage de logiciels de traitement de donnees permet d-identif.er et d'analyser 
30 ces genes. Dans ce contexte une recherche systematique portant sur rensemble des in- 
formations disponibles a ce jour a ete engagee afin d'identifier de nouvelles sequences 
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retrovirales endogenes humaines en fonction de cenains criteres d'analyse : 

- presence de longs cadres de lecture ouverts conserves au cours de 
1'evolution de 1'organisme note et pouvant laisser envisager une fonction biologique. 

- analogie avec des sequences deja caracterisees en dehors ou dans le 

5 domaine des retrovirus, 

- localisation dans des regions de susceptibilite pour certaines patho- 
logies ou a proximite de genes essentiels, par exemple dans les domaine du cancer, des 
regulation du systeme immunitaire ou dans certaines neuropathologies. 

Les recherches effectuees par les Inventeurs. dans des bases de don- 
10 nees de sequences leur ont permis ^identifier un ensemble de sequences ou de motifs 
retroviraux endogenes dont r expression normale ou pathologique peut favoriser ou 
perturber un effet protecteur vis-a-vis de processus pathologiques. ou intervenir dans 
le declenchement ou l'aggravation de pathologies. 

La presente invention a pour objet un fragment d'acide nucleique 
15 purine, caracterise en ce qu'il comprend tout ou partie d'une sequence codant pour une 
sequence retrovirale endogene humaine, qui presente au moins des motifs retroviraux 
de type em, repondant a la sequence SEQ ID NO:l ou a une sequence presentant un 
niveau d'homologie avec ladite sequence SEQ ID NO:l supeneur ou egal a 80% sur 
plus de 190 nucleotides ou superieur ou egal a 70 % sur plus de 600 nucleotides pour 

20 les domaines de type em. 

On entend par sequence homologue, aussi bien une sequence qui 
presente une identite complete ou partielle avec la sequence SEQ ID NO:l precitee 
qu'une sequence qui presente une similarite partielle avec ladite sequence SEQ ID 
NO:l. 

25 Selon un mode de realisation avantageux dudit fragment, il presente 

a la fois des motifs retroviraux correspondant a un domaine em et repondant a la 
sequence SEQ ID NO:l et des motifs retroviraux correspondant a un domaine gag et 
repondant a la sequence SEQ ID NO:2 ou a une sequence presentant un niveau 
d'homologie superieur ou egal a 80 % sur plus de 190 nucleotides ou supeneur ou 

30 egal a 70 % sur plus de 600 nucleotides pour les domaines de type em et un niveau 
d'homologie superieur ou egal a 90 % sur plus de 700 nucleotides ou superieur ou 
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egal a 70 % sur plus de 1200 nucleotides pour les domaines de type gag. lesquels 
motifs ne presentent aucune insertion ou deletion de plus de 200 nucleotides. 

Lesdits fragments constituent une nouvelle famille de sequences 
retrovirales endogenes humaines (famille HERV-7q) qui presente une homologie de 
5 sequence avec les retrovirus MSRV, tels que decrits dans la Demande Internationale 
WO 97/06260 ; lesdits fragments selon la presente invention presentent : 

- deux motifs nucleotidiques repetes de 71 1 pb (figure 3), presentant 
des signaux caracteristiques identifies dans des LTRs (Long Terminal Repeats) : 
promoters de transcription de type boites TATAA ou CCAAT. Ces domaines repetes 

1 0 encadrent trois motifs deduits de type-gag, pol et env (figure 2 ). 

- un motif de type env (positions 6965 nt - 9550 nt sur la sequence 
SEQ ID NO :3 ou sur la figure 1) qui contient un long cadre de lecture ouvert de 1620 
nucleotides (positions 7874-9493 de la sequence ID NO:3 et figure 1), codant pour 
une proteine de sequence inedite de 540 acides amines appelee enverine (figure 4 et 

15 SEQ ID NO:26) et fragment souligne de la figure 18. On retrouve a Tinterieur du 
domaine trans-membranaire de ce domaine env, un motif peptidique de type CKS- 
25/CKS-17 (figure 5), reconnu pour presenter des fonctions immunosuppressives sur 
les cellules lymphocytaires notes (M. Mitani et coll., 1987, Proc. Natl. Acad. Sci. 
USA, 84, 237-240). Un domaine de type doigt de zinc {zinc-finger) HXj_,HX 22 . 

20 3J CX 2 C (Kulkolski et coll., 1992, Mol Cell Biol, 12. 2331-2338). que Ton retrouve 
dans des domaines de type integrase est identifie dans un autre cadre de lecture. Ce 
domaine env particulier signe la caracteristique de nouveaux motifs retroviraux 
endogenes. 

- le motif (positions 3065 nt - 4390 nt sur la sequence SEQ ID NO:3) 
25 de type-gag codant pour des motifs proteiques selon la figure 6 (SEQ ID NO:58) 

(positions 3118-4198 de la SEQ ID NO:3) a ete identifie grace a des analogies avec 
des domaines gag connus. On retrouve, par exemple, la region d'homologie majeure 
QX,EX 7 R (Benit et coll., 1997, J. Virol., 71, 5652-5657). Le motif de fixation des 
acides nucleiques CXjCX^HXtC, situe en position C-terminale, est identifie dans un 
30 autre cadre de lecture (Covey et coll., 1986, Nucleic Acids Res., 14, 623-633). En 
amont du domaine gag on detecte un motif de 182 nucleotides repete deux fois (figure 
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- le domaine pol presente les consensus classiques d'une region pol 
de retrovirus au niveau des domaines protease, transcriptase reverse et RMAse H. On 
retrouve dans pol un motif proche du consensus LLDTGA (Weber et coll.. 1988. 

5 Science, 243, 928-931). Les motifs D et AF, LPQ et SP, et YVDD (Xiong et 
Eickbush, 1990, EMBO J., 9, 3353-3362), sont respectivement retrouves dans les 3°. 
4° et 5° bottes d'homologie. Les motifs YTDGSS et TDS sont presents dans la region 
de la RNAse H, 

- les regions gag et pol pourraient etre considerees comme jointives 
10 avec un passage de la region gag a la region pol par un decalage du cadre de lecture. 

La presente invention englobe les sequences appartenant a la famille 
HERV-7q telle que definie ci-dessus (presence de la sequence SEQ ID NO:l ou d'une 
sequence homologue ou presence a la fois des sequences SEQ ID NO: I et SEQ ID 
NO:2) et notamment les sequences SEQ ID NO:3-22, 28 et 61 ; elle englobe egale- 
15 ment les sequences nucleiques complementaires et les sequences inverses comple- 
mentaires des sequences precedentes ainsi que les fragments issus des regions 
codantes des sequences precedentes correspondant a un cadre glissant superieur ou 
egal a 14 nucleotides ou leurs sequences complementaires. (SEQ ID NO :37-57, 59-60 
et 121-122). 

20 Ces differents fragments peuvent avantageusement etre utilises 

comme amorces ou comme sondes (reactifs A) ; ils s ? hybrident specifiquement dans 
des conditions de forte stringence a une sequence de la famille HERV-7q. 

Parmi ces fragments, on peut citer, de preference les fragments 

suivants: 

25 . un fragment de 182 nucleotides repete deux fois, situe en amont du 

domaine gag aux positions 2502-261 1/2613-2865 de la SEQ ID NO:3 ; 

Amorces et sondes specifiaues de la region eag 

- une amorce GIF, sens, localisee dans la region amont du domaine 
gag de HERV-7q : 5' GGACCATAGAGGACACTCCAGGACTA 3' 

30 (SEQIDNO:37); 

- une amorce G1R ; anti-sens, localisee dans la region 3' terminale du 
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domaine gag : 5' CCTCAGTCCTGCTGCTGGATCATCT 3' (SEQ IDNO:38) 

- le fragment de 1505 nt amplifie par le couple G1F-G1R est utilise 
afin de generer les sondes aptes a hybrider les dtfferents produits d'amplification des 
PCR; 

5 - une amorce G2F, sens nichee : (SEQ ID NO:39) 

5' CCTCCAAGCAGTGGGAGGAAGAGAATT 3 - 

- une amorce G2R, anti-sens nichee : (SEQ ID NO:40) 
5' CCTTCCCTGTGTTATTGTGGACATCATT 3' 

- une amorce G4F, sens nichee : (SEQ ID NO:41 ) 

! 0 5 • GG AAG AAGTCTATGAATT ATTC A ATG ATGT 3 ' 

- une amorce G3F, sens nichee: (SEQ ID NO:42) 

5' GGGACACAGAATCAGAACATGGAGATT 3' 

- une amorce G4R, anti-sens nichee : (SEQ ID NO:43) 
5' GCCTTCAGAAGAGTCAGGTGACAGAGA 3' 

15 - une amorce G5R, anti-sens nichee : (SEQ ID NO:44) 

5'GAGCCTCCAAAGTCCACTTGCCTGA 3' 
Amorces et sondes specifiaues de la region env 

- une amorce E1F, sens : (SEQ ID NO:45) 

5' GATTTCAGTATCTACTAGTCTGGGTAGAT 3' 
20 - une amorce E1R, anti-sens : (SEQ ID NO:46) 

5' CTAGGAAATCCAGCTAGTCCTGTCTCA 3' 

- le fragment de 2529 nt amplifie par le couple d'amorces E1F-E1R, 
est utilise afin de generer les sondes aptes a hybrider les differents produits 
d'amplification des PCR. 

25 - une amorce E2F, sens : (SEQ ID NO:47) 

5' CCAAGACAGCCAACTTAGTTGCAGACAT 3' 

- une amorce E2R, antisens : (SEQ ID NO:48) 

5' GGACGCTGCATTCTCCATAGAAACTCTT 3' 

- une amorce E3F, sens : (SEQ ID NO:49) 

30 5' GCAATACTACATACACAACCAACTCCCAA 3' 
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- une amorce E3R, anti-sens : (SEQ ID NO:50) 

5' GGGGGAGGCATATCCAACAGTTAGTA T 

- une amorce E4F, sens : (SEQ ID NO:5 1 ) 

5' CC ATCTACACTGAACAAGATTTAT AC ACTT 3* 
5 - une amorce E4R, anti-sens : (SEQ ID NO:52) 

5' AATGCCAGTACCTAGTGCACCTAGCACT 3' 

- une amorce E5F, sens : (SEQ ID NO:53) 

5' CGAATACAACGTAGAGCAGAGGAGCTTCGAA 3' 

- une amorce E6F, sens : (SEQ ID NO:54) 

10 5 ' AGCCC A AG ATGC AGTCC AAG ACTA AG AT 3 ' 

- une amorce E5R : (SEQ ID NO:55) 

5 ' GCGTAGTAGAGGTTGTGC AGCTG AGAT 3' 

- une amorce ExF : (SEQ ID NO:56) 
CCCTTACCAAGAGTTTCTATGGAGAAT 

15 - une amorce ExR : (SEQ ID NO:57) 

ACCGCTCTAACTGCTTCCTGCTGAATT 
Tous les oligonucleotides sont con^us pour pouvoir generer une 
amorce sens et une amorce anti-sens par un decalage de la sequence de V amorce de 
reference de 1 a 7 nucleotides vers le cote 5' ou vers le cote 3*: la modification de la 
20 sequence peut entrainer une modification de la taille de F amorce de 1 a 7 nucleotides 
selon les cas. Les amorces choisies peuvent etre optimisees selon les cas par un 
raccourcissement ou un allongement portant sur 1 a 9 nucleotides. 

De maniere preferee, Fhybridation, le clonage, le sous-clonage, 
l'obtention, la preparation et F analyse des acides nucleiques, des peptides et des anti- 
25 corps, le sequen9age des acides nucleiques et des peptides, Fhybridation in situ et 
rimmunohistochimie sont realises dans les conditions decrites dans les ouvrages 
suivants : 

- Current Protocols in Molecular Biology. Eds. F.M Ausubel, R. 
Brent & R.E Kingston et coll. Green Publishing associates and Wiley Interscience. 

30 - Molecular Cloning: a laboratory manual. Eds. J. Sambrook, E.F. 

Fritsch & T. Maniatis. Cold Spring Harbor Laboratory Press. Cold Spring Harbor. 
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- The Practical Approach series. Eds. D. Rickwood & B.D. Ames. 
IRL Press and Oxford University Press. En particuiier, antibodies I & II; DNA cloning 
I, II, III; Nucleic acid and protein sequence analysis; Nucleic acid hybridization; 
Nucleic acid sequencing ; Oligonucleotide synthesis; Protein purification applications; 

5 Protein purification methods; Protein sequencing; Transcription and translation; Gels 
electrophoresis of nucleic acids; Gels electrophoresis of proteins; Genome analysis; 
HPLC of macromolecules; Human genetic diseases; Microcomputing in biology; 
Molecular neurobiology; Mutagenicity testing; Essential molecular biology I & II. 

- Proteome research: New frontiers in functional genomics. Eds 
1 0 M.R. Wilkins & coll.. Springer. 

La sequence retrovirale endogene humaine (SEQ ID NO:3). situee 
sur le bras long du chromosome 7 correspond a la sequence HERV-7q ; elle presente 
10,5 kb (fig. 1 et 2) et repond aux criteres precedemment definis. 

La recherche de domaines presentant des similitudes, tout ou partie, 

15 avec les regions gag et env de HERV-7q a abouti a F identification de nouvelles 
sequences retrovirales endogenes. Ces sequences peuvent presenter la structure d'un 
retrovirus endogene complet comme la sequence retrovirale endogene situee a proxi- 
mite du gene des sous-unites alpha et delta du recepteur des cellules-T, et denommee 
en consequence HERV-TcR ; a titre d'exemple la figure 7 montre la comparaison des 

20 alignements nucieiques des domaines gag respectifs de HERV-7q et HERV-TcR 
(sequence HG12, SEQ ID NO: 19). On trouve aussi des structures retrovirales 
partielles. Ces domaines retroviraux similaires a HERV-7q sont identifiers dans des 
sequences nucieiques independantes comme le montre leur localisation chromo- 
somique. Des motifs nucieiques (appeles ici, HEx ou HGx et respectivement anaio- 

25 gues a des domaines de type env ou gag) ressemblant aux domaines env ou gag de 
HERV-7q ont ete retrouves, a l'aide des banques de donnees precitees : 

- HE2 : chromosome 17 (SEQ ID NO:4), 

- HE3 et HG3: chromosome 6 (SEQ ID NO:5 et 6), 

- HE4 : chromosome X (SEQ ID NO:7), 

30 - HE5 : chromosome X q22 (SEQ ID NO:8), 

- HE6 et HG6 : chromosome 1 q23.3-q24.3 (SEQ ID NO:9 et 10), 
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- HE7 : chromosome 7 p 1 5 (SEQ ID NO: 1 1 ), 

- HE8 et HG8 : chromosome 19 (SEQ ID NO: 12 et 13). 

- HE9 : chromosome X (SEQ ID NO: 14), 

-HE10: chromosome Xql3. 1-21.1 (SEQ IDNO:15), 
5 -HE11 etHGll : chromosome 7 q2 1-22 (SEQ IDNO:16et 17), 

- HE12 et HG12, dans HERV-TcR : chromosome 14 ql 1.2 (SEQ ID 

NO:18et 19), 

- HE 13 (SEQ ID NO:61) : chromosome 6 q24. 1-24.3 

La presente invention englobe egalement les fragments codants et 
10 non codants pour tout ou partie de Penverine comprenant au mo ins 14 nucleotides et 
notamment les fragments codant pour ia partie C-terminale de Penverine, soit a partir 
de Pacide amine 291, soit a partir de Pacide amine 321. a compter de la premiere 
methionine. 

Ces fragments comprennent en particulier une zone critique ou deux 
15 insertions de 12 nucleotides ont ete caracteriseds : 

- une premiere insertion a ete identified (sequence A), chez des indi- 
vidus de 2 groupes (malades et temoins). Cette insertion situee entre les acides amine 
487 et 488, permet d'inserer le tetrapeptide VLQM. Une analyse comparative montre 
que cette insertion est identified dans une region homologue situee dans la sequence 

20 HE13, appartenant a ia famille HERV-7q. L'amplification de la sequence de type 
HE13, pourrait indiquer qu'il existe une alteration de la sequence de Penverine de 
HERV-7q, ce qui favoriserait Pamplification de la sequence contenue dans HE 13. 
Cette observation permet aussi d'utiliser cette insertion comme element specifique 
d' amplification de sequences de type HE13. 

25 Une deuxieme insertion (sequence B) a ete identified chez un patient 

presentant une SEP. L'insertion de 12 nucleotides est situee au niveau de Pacide 
amine 495 et code pour le tetrapeptide MQSM. II est remarquable de constater que 
cette insertion est aussi identified dans une region homologue situee dans HE13. 

Sequence A: TAAACTACAAATGG TTCTTCAAATGG AGCCCA 

30 (SEQ ID N0.59) 
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Sequence B: GATGCAGTCCAAGA TGCAGTCCATGA CTAAGA 

(SEQ ID NO:60). 

Ces observations mettent en evidence des modifications de la 
sequence de l'enverine de type HERV-7q qui constituent la base d'une strategic de 
5 detection par amplification specifique d'alleles (AS-PCR), permettant de detecter ces 
differences dans une population et qui pourraient corresponds, soit a une muta- 
tion/deletion associee a une certaine susceptibilite, soit a un polymorphisme, soit a une 
mutation/deletion associee a une pathologie comme la sclerose en plaques. 

Les alignements des domaines env (fig. 8) et gag (fig. 9) explicitent 
10 les niveaux d'homologie observes entre les sequences decrites ci-dessus et les sequen- 
ces homologues dans HERV-7q. Les analogies peuvent s'etendre aux motifs retro- 
viraux flanquants. 

Une analyse des sequences etiquettes disponibles dans les banques 
de donnees montre que des transcrits appartenant a certains des membres de cette 
15 famille, en particulier HERV-7q, s'expriment essentiellement dans des tissus d'origine 
fcetale ou placentaire. 

Des sequences polypeptidiques generees par ces transcrits peuvent 
done etre potentiellement produites et des fonctions ou activites biologiques peuvent 
etre envisagees, par analogie avec des polypeptides biologiquement actifs d'origine 
20 viraie ou retro viraie ; par exempie, ies motifs peptidiques de type CKS-17 (Haraguchi 
et al., PNAS, 1995, 92, 5568-5571) (fig. 5) ou CKS-25 (Huang S.S et Huang J.S, J. 
Biol. Chem. 1998, 273, 4815-4818), qui presentent des fonctions immunomodulatrices 
sur les cellules lymphocytaires h6tes, Les differences de sequence observees et 
d'eventuelles modifications normales ou pathologiques, sont en particulier, a l'origine 
25 d'une modulation de la fonction. 

HERV-7q represente le paradigme de la nouvelle famille de 
sequences retrovirales endogenes humaines ou de motifs retroviraux endogenes. 

HERV-7q et certaines des sequences retrovirales endogenes apparte- 
nant a sa famille, presentent un domaine de type pol analogue a des sequences retro- 
30 virales de type pol comme par exempie la region pol identifiee dans le retrovirus 
MSRV associe a la sclerose en plaques et decrit par H. Perron et al. (1997, Proc. Natl. 
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Acad Sci. USA, 94, 7583-7588 ; Demande Internationale PCT WO 97/06260). 

Toutefois, les sequences selon la presente invention se distinguent 
des sequences retrovirales exogenes infectieuses analogues a MSRV anterieurement 
decrites en ce que les sequences gag et env, selon V invention sont significativement 
differentes selon les criteres precedemment definis et en fonction de certaines caracte- 
ristiques specifiques, par exemple le long cadre de lecture ouvert du domaine env de 
HERV-7q ; elles seraient a meme de permettre de signer une pathoiogie lorsqu'elles 
presentent des insertions, des deletions, des decalages de cadre de lecture ou des 
mutations. 

En effet, les differences observees entre les sequences humaines de 
type HERV-7q, qui sont isolees d'individus reputes normaux et les sequences issues 
de certains echantillons d'origine pathologique, ne sont pas distributes au hasard. Des 
comparaisons menees entre la region gag provenant de particules retrovirales infec- 
tieuses (N° d'accession EMBL; A60168, A60200, A60201, A60171...) et la sequence 
gag correspondante de HERV-7q (fig. 9), permettent d'observer que les mutations 
affectent preferentiellement des codons non-sens. Par exemple. deux codons non-sens 
dans HERV-7q sont remplaces par un codon arginine dans A60200, ce qui permet 
d'obtenir une sequence deduite de 109 acides amines pour HERV-7q et de 166 acides 
amines pour A60200. Les changements de base permettent en consequence de prolon- 
ger ie cadre de lecture et de coder potentiellement pour des structures polypeptidiques 
de plus grande taille (figure 10). 

De meme, une sequence de type env provenant de particules retro- 
virales infectieuses, presente une analogie significative avec le domaine env de 
HERV-7q (figure 11). Ces analogies marquees entre sequences retrovirales exogenes 
et endogenes pourraient etre a Torigine du declenchement ou de l'aggravation de 
certains processus pathologiques, en particulier de certaines maladies auto-immunes, 
comme la sclerose en plaques. A cet egard, on peut remarquer que certaines des 
sequences retrovirales endogenes decrites dans V invention se situent a proximite ou 
dans des regions reputees presenter une susceptibilite pour la sclerose en plaques : par 
exemple HERV-7q et la region 7q21-22 du chromosome 7, de meme pour HE 12 et 
HG12 dans HERV-TcR et la region du gene codant pour les chaines alpha et delta du 
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recepteur des cellules-T, HE2 et le chromosome 17, ou HE3, HE 13 et HG3 et le 
chromosome 6, par exemple, les sequences HE1 1 et HG1 K autour de la region 7q 21- 
22 ou encore HE4, HE5, HE6, HE9, HE 10 ou HG10 sur le chromosome X. Ces 
sequences seraient done a meme de fournir des moyens de localisation ou 
5 d' identification des genes de predisposition. 

On n'observe aucune homologie significative avec des sequences 
retrovirales endogenes deja decrites, par contre, on peut relever une homologie 
limitee, permettant d' identifier une structure generate de domaine env; toutefois, 
ladite homologie est inferieure aux criteres definis selon 1' invention entre les 

10 domaines env de la sequence HERV-7q (SEQ ID NO :1) et de la sequence HERV-9 
(figure 12). La figure 1 1 montre des homologies etendues entre la sequence HERV-7q 
avec une sequence retro virale exogene (N° d'accession EMBL : A60170). 

Les sequences retrovirales endogenes humaines appartenant a la 
famille de HERV-7q, peuvent proteger contre des agressions liees a l'environnement 

15 ou constituer un benefice pour l'individu. Cet effet benefique pourrait etre une des 
raisons possibles de la pression de selection exercee sur certaines de ces sequences et 
du caractere potentiellement fonctionnel des structures proteiques deduites identi- 
fies : par exemple le long cadre de lecture ouvert apte a coder pour une nouvelle pro- 
teine et correspondant au domaine env de HERV-7q. 

20 Les sequences retrovirales endogenes humaines appartenant a la fa- 

mille de HERV-7q pourraient etre associees par exemple, a des pathologies en relation 
avec les processus lies au cancer, aux neuropathologies a composante auto-immune ou 
a tout autre processus pathologique en association ou non avec des virus ou retrovirus 
endogenes ou exogenes. Leur action pourrait porter sur la declaration, l'aggravation, la 

25 modification du calendrier d'apparition ou encore la protection vis a vis de la maladie. 

Dans le contexte d' application a des pathologies autoimmunes 
(comme par exemple le lupus, le syndrome de Sjdgren, la polyarthrite rhumatoide, la 
sclerose en plaques...), on peut relever des analogies significatives entre les motifs re- 
troviraux endogenes identifies et des motifs retrouves dans des structures retrovirales 

30 caracterisees chez des patients presentant des pathologies autoimmunes comme la 
sclerose en plaques : par exemple des fragments de domaine gag (recemment dispo- 
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nibles dans les banques de donnees) provenant de particules retrovirales infectieuses 
ou encore la sequence complete du domaine pol correspondant au virus MSRV associe 
a la sclerose en plaques. Ces motifs retroviraux possedent des analogies significatives 
avec les sequences endogenes homologues de type HERV-7q, ce qui permet 
5 d'envisager une association directe ou indirecte avec des processus pathologiques. 
dont la sclerose en plaques, en association ou non avec MSRV. 

L'interet de ces sequences depasse le cadre des maladies auto- 
immunes. En dehors de ['importance generale des motifs retroviraux dans le declen- 
chement ou F aggravation d'un processus tumoral, bien montre en particulier dans les 

10 modeles murins (H. Fan dans The retroviridiae* 1994, ed. J. A. Levy. Plenum. New 
York, p. 313-353), ces sequences pourraient se retrouver a proximite ou au sein de 
genes importants et en alterer l'expression : par exemple HERV-TcR et les genes des 
sous-unites alpha et delta du recepteur des cellules T impliquees dans des perturba- 
tions de la fonction immunitaire. 

15 La presente invention englobe, en outre, V utilisation de sequences 

associees aux sequences de la famille HERV-7q pour la detection et/ou le pronostic de 
differentes maladies auto-immunes (neuropathologies, en particulier) ; ces sequences 
codent pour tout ou partie d'un facteur, dont la fonction, la regulation/deregulation ou 
l'alteration (polyadenylation, epissage alternatif) est associee a l'expression normale 

20 ou pathologique ou a la regulation/deregulation des motifs appartenant a la famille 
HERV-7q et correspondent a des transcrits ou des ADNc des sequences nucleotidiques 
codant pour des genes situes dans des regions flanquantes ou encadrant des sequences 
retrovirales de la famille HERV-7q. 

On entend par region flanquante, toute region situee a proximite 

25 (incluse dans ou incluant) une sequence retrovirale endogene appartenant a la famille 
HERV-7q, telle que definie ci-dessus, jusque et y compris les genes immediatement 
contigus et/ou situes a une distance ne pouvant exceder 120 kb. 

Les Inventeurs ont maintenant trouve que la presence des sequences 
retrovirales telles que defmies ci-dessus, perturbent l'expression ou alterent la struc- 

30 ture des sequences flanquantes defmies ci-apres. 

Les transcrits desdites sequences flanquantes (et leurs fragments, 
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notamment ceux soulignes ou en italique dans les figures 14-16, 22-26. sont definies 
ci-apres : 

- a 1021 pb en amont de HERV-7q, on identifie une sequence retro- 
virale endogene appelee RH7 (SEQ ID NO:62 et figure 22) ; cette sequence est situee 

5 en 5 ? de la sequence HERV-7q ; dans la figure 22, la partie en italique correspond au 
debut de la sequence HERV-7q ; la sequence RH7 est soulignee : deux sites de 
polyadenylation putatifs sont en gras. Cette sequence SEQ ID NO:62 presente une 
homologie significative, sur plus de 6 kb, avec des sequences retroviral endogenes 
de type RGH (figure 13). Des sequences appartenant a cette famille s'expriment en 

10 particulier chez des patients presentant une arthrose rhumatoide (Nakagawa et coll., 
(1997), Arthritis. Rheum., 40 ? 627- 638). La presente invention inclut egalement des 
fragments de la sequence SEQ ID NO:62, comprenant entre 14 et 50 nucleotides 
(utilisation comme amorces), de preference entre 14 et 25 nucleotides ou au moins 25 
nucleotides (utilisation comme sonde), lesquels fragments presentent les caracteris- 

15 tiques suivantes : les 4 nucleotides de l'extremite 3' sont differents des motifs corres- 
pondant de la sequence RGH2 (sequence du bas dans la figure 13, n° accession a 

GenBank:D110 18). 

- a moins de 9 kb en amont de HERV-7q, on identifie la sequence 
RAM75 (SEQ ID NO:63 et figure 14) contenant les 24 exons codants (qui couvrent 

20 pres de 41 kb), du gene de l'ATPase peroxysomale PEX1. PEX1, en association avec 
PEX6 est responsable de V importation des proteines peroxysomales et de la stabilisa- 
tion du recepteur PEX5. Une perturbation/alteration affectant PEX1 est responsable de 
diverses neuropathologies comme le syndrome de Zellweger, Fadrenoleucodystrophie 
neonatale et la forme infantile de la maladie de Refsum (Reuber et coll., (1997), 

25 Nature Genet., 17, 445- 448). On peut rappeler que la fonction principale des peroxy- 
somes est associee au metabolisme des acides gras, en particulier par des processus de 
p-oxydation. Une alteration du gene identifie dans la sequence RAM75 ou de son 
expression, par modification de la fonction des regions 5' et 3' regulatrices ou encore 
par modification des epissages ou des processus de polyadenylation, en particulier 

30 sous rinfluence de motifs retroviraux voisins, seraient a meme de perturber 
^expression ou la structure de l'ATPase et par consequent de perturber une des 
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fonctions peroxysomales, en particulier le metabolisme des lipides, en particulier 
myeliniques, avec des consequences pour certaines pathologies, dont des neuropatho- 
logies, comme la sclerose en plaques ; les parties soulignees (figure 14) correspondent 
aux 24 exons codants. 

5 La presente invention inclut egalement les fragments de la sequence 

SEQ ID NO:63, inclus dans les 24 exons codants precites et comprenant au moins 14 
nucleotides. 

L'analyse du profil depression (transcrits et proteines) de la 
sequence RAM75 (SEQ ID NO:63) est un bon indicateur du diagnostic differentiel des 
1 0 neuropathologies a composante auto-immune. 

A la figure 14, les exons codants sont soulignes. Les codons 
d'initiation et non-sens ainsi que les sites putatifs de polyadenylation sont en gras et 
soulignes. 

- a 0.7 kb en aval de la sequence HERV-7q et sur pres de 17 kb 
15 (SEQ ID NO:64 et figure 15), on identifie la sequence nucleotidique RAV73, ou Ton 

detecte des sequences etiquettes et des exons potentiels aptes a produire une ou 
plusieurs sequences polypeptidiques ; V invention inclut egalement des fragments de 
cette sequence SEQ ID NO:64 compris dans les sequences etiquettes et les exons 
potentiels tels qu'ils apparaissent (parties soulignees) a la figure 15, lesquels 
20 fragments component au moins 1 4 nucleotides. 

- a 120 kb en amont de la sequence HG3, et sur 15 kb, se trouve la 
sequence nucleotidique RBP3 (SEQ ID NO:65 et figure 23), qui couvre l'extremite 
3'du gene codant pour un facteur de transcription de la famille Blimp- 1 (SEQ ID 
NO: 119 et figure 25), une proteine de 789 acides amines qui est un represseur de 

25 P expression du gene de Finterferon-beta (Keller et Maniatis, Genes Dev., (1991), 5, 
868-879), qui est deja associe a certaines pathologies malignes (Mock et coll., 
Genomics, (1996), 37, 24-28), et qui pourrait jouer un role dans la differentiation et la 
pathogenese des cellules B. L'interet de l'association possible de la sequence retro- 
virale endogene contenant les motifs HG3 et HE3 et de Blimp-1 est multiple, dans le 

30 cas de pathologies, et en particulier la sclerose en plaques. Blimp-1 agit en particulier 
sur les cellules B dont on connait la contribution dans les processus inflammatoires 
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associes a la sclerose en plaques. Blimp- 1 est capable de bloquer I'induction virale du 
promoteur INFP dont on connait l'aptitude a reduire la frequence des poussees et la 
progression lesionnelle chez des patients atteints de SEP. Une perturbation de 
['expression ou de la structure de Blimp- 1, en relation avec un element retroviral de 
5 type HERV-7q, est associee en consequence a des neuropathologies ou a des maladies 
a caractere auto-immun, comme la sclerose en plaques ; cette sequence nucleotidique 
RBP3 (SEQ ID NO:65) contient des motifs nucleotidiques identifies dans la sequence 
nucleique codant pour le gene Blimp- 1 ; 1' invention inclut aussi la detection des 
sequences ARNm de la proteine Blimp- 1 (SEQ ID NO.l 19). 
j 0 - la sequence retrovirale endogene de type HERV-7q, contenant HE3 

et HG3. se trouve situee dans la region HIS correspondant a un intron s'etendant sur 
plus de 46 kb (SEQ ID NO:66), d'un gene qui pourrait coder pour F analogue d'APS 
(figure 24), une proteine de 275 acides amines specifique d'apoptose. surexprimee 
dans differents cellules en culture apres declenchement d'un processus apoptotique 
1 5 (Hammond et coll., FEBS Lett., (1998), 425, 391- 395). L'intron se situe au niveau de 
l'acide amine 231 d'APS. L'extremite de HE3 est a plus de 12 kb de l'extremite 5' de 
l'intron, alors que HG3 est situe a plus de 28 kb de l'extremite 3' de l'intron. Des 
processus apoptotiques sont associes a la sclerose en plaques. En particulier. il a ete 
decrit un processus apoptotique affectant des astrocytes et des oligodendrocytes en 
20 presence d'une fraction purifiee de liquide cephalo-rachidien de patients atteints de 
sclerose en plaques (Menard et coll., J. Neurol. Sci., (1998) , 1 54, 209- 221). 

Enfin, il faut souligner que la region nucleique contenant HE3, HG3, 
HI3 et RBP3 est localised au niveau du bras court du chromosome 6, en 6p21 . qui est 
une region proposee de susceptibilite a la sclerose en plaques (The Multiple Sclerosis 
25 Genetic Group, Nature Genet., (1 996), 13, 469- 472). 

L'interaction entre les sequences de type HERV-7q et les sequences 
flanquantes et I'importance de l'etablissement d'un profil depression incluant une ou 
plusieurs des sequences precitees pour etablir un diagnostic differentiel d'une neuro- 
pathologie apparait encore plus du fait que Ton observe que les sequences HG12 et 
30 HE12 sont situees dans une region intronique du gene codant pour les sous-unites 
alpha et delta des recepteurs des cellules T. Les recepteurs des cellules T sont impli- 
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ques dans les processus de regulation immunitaire et leur influence a ete proposee 
dans le cas de maladies auto-immunes, dont la sclerose en plaques. 

L' invention a egalement pour objet les transcrits generes a partir des 
sequences precitees ainsi que celles presents eventuellement des modifications avec 
5 les sequences de reference decrites dans Invention lorsquils sont expnmes chez 
certains patients. 

En effet, les systemes de regulation de 1' expression des proteines 
retroviral de HERV-7q, qui sont presents dans les motifs de type LTR, pourraient 
influencer l'expression de genes situes dans le voisinage chromosomique proche ou 
10 eloigne et induire des perturbations a caractere immunologique et/ou neurologique. 
Par exemple la sequence retroviral endogene HERV-TcR, se trouve a proximite 
immediate des genes des sous-unites alpha et delta du recepteur des cellules-T prece- 
demment decrit. Les motifs de type LTR pourraient aussi coder pour des superanti- 
genes (Acha-Orbea et Palmer, 1991, Immunol. Today, 12, 356-361). D'une maniere 
15 generale des proteines retrovirales de type HERV-7q ou apparente, ou leurs formes 
tronquees ou partielles pourraient etre impliquees dans des phenomenes de cytotoxi- 
cite ou de superanteginicite, comme par exemple celles issues du long cadre de lecture 
ouvert identifie dans le domaine env (figure 4). 

Des sequences du type des LTR 5' et 3' de HERV-7q, fortement 
20 conserves sont concernees par de tels effets regulateurs. A titre d'exemple on decrit 
LTX, une sequence comparable a celle d'une LTR de HERV-7q (SEQ ID NO:67 et 
figure 16), et qui se trouve au cceur d'un intron de plus de 49 kb, mais a 2 kb du site 5' 
donneur, du gene de FMR2 associ6 au X-fragile et codant pour une proteine de 131 1 
acides amines (figure 26). Les LTR modulent l'epissage altematif (Kapitonov et 
25 Jurka, (1999), J. Mol. Evol., 48, 248- 251), l'expression du gene, la fixation sur des 
proteines nucleaires (Akopov et coll., (1998), FEBS Lett., 421, 229- 233), ou permet- 
tent l'obtention d'un signal de polyadenylation altematif (Goodchild et coll., (1992) , 

Gene, 121,287- 294). 

D'une maniere generale, on peut remarquer l'existence de plusieurs 

30 sequences retrovirales endogenes de type HERV-7q (HE4, HE5. HE9, HE10), situees 
au niveau du chromosome X qui represente le chromosome associe au plus grand 
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nombre de pathologies. 

A cet egard, on peut relever que des motifs retroviraux issus de 
regions defectives sont aptes a presenter des fonctions biologiques: par exemple. la 
proteine d'enveloppe pl5E issue de motifs retroviraux defectifs, possede une activite 
5 anti-inflammatoire et immunosuppressive (Snyderman et Ciancolo, 1984, Immunol 

Today, 5, 240-244). 

Ces structures sont vraisemblablement a meme de provoquer des 
breches ou d' amplifier des deregulations dans les processus de defense immunitaire. 
Certains des motifs des domaines gag, env et de type LTR peuvent etre associes a une 

10 fonction particuliere ou peuvent contribuer a la fonction normale ou pathologique des 
domaines flanquants tels que definis ci-dessus (SEQ ID NO:62-67). Des recombinai- 
sons avec un element d'origine exogene, retroviral ou non, peut dormer lieu a la 
production de motifs nucleiques ou proteiques qui pourraient soit proteger, soit 
declencher, ou favoriser ou aggraver une pathologic De meme, une structure retro- 

1 5 virale contenant des elements retroviraux endogenes selon i'invention seraient a meme 
de provoquer un processus pathologique apres passage par un cycle transitoire 
exogene puis reintegration dans une region sensible ou critique du genome humain. 

On peut ainsi obtenir des profils d' expression (transcrits et even- 
tuellement proteines) qui correspondent aux neuropathologies precitees. 

20 De meme, la combinaison de motifs appartenant a ia famille de 

HERV-7q, ou d'elements induits par des motifs appartenant a la famille de HERV-7q, 
avec des motifs d'origine ou induits de maniere exogene seraient a meme de pouvoir 
declencher, ou aggraver un processus pathologique ou au contraire de favoriser une 
protection ou une remission partielle ou une guerison totale et definitive. 

25 La detection rendue possible des domaines de type HERV-7q, 

suggere des applications possibles a la fois au niveau prophylactique, du pronostic et 
du diagnostic : par exemple des approches immunologiques ou d'amplification 
genique permettant de comparer des individus normaux servant de reference avec des 
patients, seraient a meme de favoriser le depistage, d'ameliorer la detection precoce de 

30 la declaration de la maladie et/ou de suivre revolution d'une pathologie chez des 
patients pouvant presenter une susceptibilite ou ayant declare la maladie ou encore 
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chez des individus considered comme normaux, selon les criteres cliniques actueis. 

Les sondes nucieiques et immunologiques specifiques, telles que 
definies, dans la presente invention sont a meme de favoriser V identification et la 
detection de motifs anormalement exprimes dans le cadre de pathologies associees au 
5 cancer, ou de neuropathologies en particulier auto-immunes, au premier rang 
desquelles la sclerose en plaques. 

La presente invention a egalement pour objet des sequences 
nucieiques hybrides, caracterisees en ce qu'elles comprennent des sequences ou motifs 
appartenant a la famille de HERV-7q, ou d'elements induits par des motifs apparte- 
10 nant a la famille de HERV-7q, avec des motifs d'origine ou induits de maniere 
exogene (sequences retrovirales exogenes) ; de telles sequences hybrides sont vrai- 
semblablement a meme de pouvoir declencher, ou aggraver un processus pathologique 
ou au contraire de favoriser une protection ou une remission partielle ou une guerison 
totale et definitive. 

1 5 La presente invention a egalement pour objet un reactif de diagnostic 

pour la detection differentielle de sequences nucieiques endogenes humaines 
completes ou partielles, presentant des motifs retroviraux, selectionnes parmi les 
sequences SEQ ID NO :1 et/ou SEQ ID NO :2, caracterise en ce qu'il est selectionne 
dans le groupe constitue par les sequences SEQ ID NO: 1-22, 28, 37-57, 59-61 et 121- 

20 122, les sequences nucieiques complernentaires et les sequences inverses comple- 
mentaires des sequences precedentes, par les fragments nucleotidiques capables de 
definir ou d'identifier les sequences SEQ ID NO:l et/ou SEQ ID NO:2 et toute 
sequence flanquante ou les chevauchant ainsi que par les fragments issus des regions 
codantes des sequences SEQ ID NO: 1-22 et 61, correspondant a un cadre glissant 

25 superieur ou egal a 14 nucleotides ou leurs sequences complernentaires, eventuelle- 
ment marquees avec un marqueur approprie ainsi que par les sequences telles que 
definies aux figures 18-21. 

Les sequences des sondes nucieiques, ribonucleiques et oiigo- 
nucleotidiques utilisees seront choisies dans les regions em et gag ou leur regions 

30 flanquantes : par exemple les oligonucleotides amorces pour HERV-7q, seront choisis 
dans les regions situees entre les nucleotides 3065 et 4390, les nucleotides 6965 et 
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9550 ou les nucleotides 2502-2865 de la SEQ ID NO:3, ainsi que dans toute sequence 
adjacente (amont ou aval) capable de permettre une amplification specifique (figure 
1)- 

Parmi les marqueurs appropries, on peut citer, les isotopes radio- 
5 actifs, les enzymes, les fluorochromes, des marqueurs chimiques (biotine). les 
haptenes (digoxygenine) et les anticorps ou analogues de bases appropriees. 
De maniere preferee : 

- ledit reactif est selectionne parmi les sequences SEQ ID NO:37-57 
et est apte a etre utilise comme amorce. 
10 - ledit reactif est selectionne parmi les sequences suivantes : 

un fragment de 1505 nt amplifie par le couple d' amorces SEQ 
ID NO:37 et SEQ ID NO:38 (amorces GIF et G1R). 

un fragment de 2529 nt amplifie par le couple d' amorces SEQ 
ID NO:45 et SEQ ID NO:46 (amorces E1F et E1R), 
1 5 un fragment de 1 82 nucleotides repete deux fois, situe en amont 

du domaine gag aux positions 2502-261 1/2613-2865, 

des fragments codants ou non-codants pour tout ou partie de 
Tenverine, comprenant au moins 14 nucleotides et notamment les fragments codant 
pour la partie C-terminale de 1'enverine, soit a partir de I'acide amine 291, soit a partir 
20 de Facide amine 321, a compter de la premiere methionine, 

et est apte a etre utilise comme sonde. 

La presente invention a egalement pour objet un procede de detec- 
tion rapide et differentiel des sequences nucleiques retrovirales endogenes de type env 
ou env et gag, de leurs variants normaux ou pathologiques, par hybridation et/ou 
25 amplification genique, realise a partir d'un echantillon biologique, lequel procede est 
caracteris6 en ce qu'il comprend : 

(a) une etape dans Iaquelle Ton met en contact un echantillon biolo- 
gique a analyser avec au moins une sonde telle que definie ci-dessus et 

(b) une etape dans Iaquelle on detecte par tout moyen approprie, le 
30 ou les produits resultant de V interaction sequence nucleotidique-sonde. 

Conforrnement audit procede, il peut comprendre : 
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* prealablement a l'etape (a) : 

. une etape de preparation du tissu ou du liquide biologique 

concerne, 

. une etape d'extraction de facide nucleique a detecter. et 
5 . au moins un cycle d'amplification genique et 

* posterieurement a l'etape (b) : 

. une etape de comparaison des sequences nucleiques obtenues dans 
ledit echantillon biologique avec les sequences retroviraies endogenes humaines selon 
T invention par tout moyen approprie et notamment par sequenqage, Southem-blot, 
10 coupure de restriction, SSCP ou toute autre methode permettant d 1 identifier une inser- 
tion ou une deletion ou encore une simple mutation entre les differentes sequences 
comparees. 

Conformement a 1' invention, les sequences retroviraies endogenes 

humaines selon Tinvention sont ainsi comparees aux sequences nucleiques presentes 
15 dans rechantillon biologique a analyser et permettent la detection de sequences 

homologues de patients atteints de pathologies, susceptibles de mettre en jeu une 

modification de leur genome. 

De maniere avantageuse, lesdites comparaisons geniques sont 

menees a partir d'ADN genomique provenant d'individus temoins et de patients. 
20 Une amplification genique classique par PCR sera menee a 1'aide 

d'amorces 5' -sens et 3' -antisens encadrant ou comprenant la zone a etudier (zone env 

ou zone gag). 

Egalement de maniere avantageuse, les sequences des sondes 
nucleiques, ribonucleiques et oligonucleotidiques utilisees sont choisies dans les 

25 regions env et gag ou leurs regions flanquantes : par exemple les oligonucleotides 
amorces pour HERV-7q, seront choisis dans les regions situees entre les nucleotides 
3065 et 4390 et les nucleotides 6965 et 9550, ainsi que dans toute sequence adjacente 
(amont ou aval) capable de permettre une amplification specifique (figure 1), comme 
precise ci-dessus. Elles sont de preference selectionnees dans le groupe constitue par 

30 un fragment de 1505 nt amplifie par le couple d'amorces SEQ 

ID NO:37 et SEQ ID NO:38 (amorces GIF et GIR), 
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un fragment de 2529 nt amplifie par le couple d'amorces SEQ 
ID NO:45 et SEQ ID NO:46 (amorces E1F et E1R). 

L/etape d'amplification genique est notamment realisee a Taide 
d'une des techniques d'amplification genique suivante : amplification par la Qp- 
replicase, PCR, LCR, ERA, CPR ou SDA. 

La presente invention a egalement pour objet des sequences 
chimeres, caracterisees en ce qu'elles sont constitutes par un fragment de 17 a 40 
nucleotides d ? une sequence flanquante telle que definie ci-dessus associee a un motif 
retroviral endogene de type HERV-7q comprenant entre 1 7 et 40 nucleotides, tel que 
dcfini ci-dessus. 

La presente invention a egalement pour objet un procede de detec- 
tion des transcrits, tels que definis ci-dessus, caracterise en ce qu'il comprend : 

- le prelevement des ARN messagers provenant d'echantillons 
biologiques (tissus, cellules, fluides biologiques) temoins et d'un echantillon analogue 
preleve chez des patients et 

- 1' analyse qualitative et/ou quantitative desdits ARNm, par hybri- 
dation in situ, par dot-blot, Northern-blot, RNAse mapping ou RT-PCR. a l'aide d'un 
reactif de diagnostic tel que defini ci-dessus. 

La presente invention a egalement pour objet une methode de detec- 
tion et/ou devaluation d'une sur-expression/sous-expression ou d'une modification 
d'au moins Tune des sequences ou fragments de sequences retrovirales endogenes de 
type HERV~7q et/ou de leurs sequences flanquantes associees. caracterisee en ce 
qu'elle comprend : 

- le depot sur un support approprie comme par exemple un filtre de 
nylon, une lame de verre ou leur equivalent, de l'ADNc ou son equivalent provenant 
de clones, de produits de PCR obtenus a partir d' ADN genomique, de produits de RT- 
PCR provenant de transcrits ou encore de sequences oligonucleotidiques specifiques, 
lesdites sequences d'ADN etant des sequences ou des fragments de sequences retro- 
virales endogenes de type HERV-7q et/ou leurs sequences flanquantes, telles que 
definies ci-dessus, constitutes par les transcrits et ADNc des sequences genomiques, 
qui codent pour tout ou partie d'un facteur, dont la fonction, la regulation/deregulation 
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ou ['alteration est associee a l'expression normale ou pathologique ou a la regula- 
tion/deregulation de motifs appartenant a ladite famille HERV-7q, ces sequences 
correspondant a des sequences nucleotidiques codant pour des genes situes dans des 
regions flanquantes situees en amont et/ou en aval d'une sequence retrovirale de ladite 
5 famille HERV-7q et dont Tune des extremites ne peut se trouver a une distance 
excedant 120 kb, et/ou une sequence chimere telle que definie ci-dessus. 

- i'hybridation dudit support avec au moins une sonde marquee de 
maniere adequate obtenue, par exemple, par retrotransposition d'un melange d'ARN 
provenant de cellules, de tissus ou de liquides biologiques provenant de temoins 

10 reputes normaux, de membres de populations ethniques differentes, de patients atteints 
de pathologies souvent associees a une expression de retrovirus, comme les processus 
tumoraux, ou comme les maladies auto-immunes, et 

- la detection des hy brides formes. 

Selon un mode de mise en ceuvre avantageux de ladite methode, 
15 ledit transcrit ou ADNc est selectionne dans le groupe constttue par les sequences 
SEQ ID NO:62-67 et 1 19 et leurs fragments correspondant a un cadre glissant supe- 
rieur ou egal a 14 nucleotides ou leurs sequences complementaires. 

Selon un autre mode de mise en ceuvre avantageux de ladite 
methode, ledit support comprend en outre toute sequence retrovirale endogene ou 
20 exogene. 

La methode des puces a ADN (Bowtell, (1999), Nature Genet., 21, 
25- 32), est utilisee pour evaluer la modification de ['expression de tout ou partie de 
certaines des sequences d'origine retrovirale de type HERV-7q et des sequences 
flanquantes, Brievement de TADN provenant de clones, de produits de PGR obtenus a 

25 partir d' ADN genomique, de produits de RT-PCR provenant de transcrits ou encore de 
sequences oligonucleotidiques specifiques, sont deposees sur un support, comme par 
exemple un filtre de nylon, une lame de verre ou leur equivalent. Les sequences 
nucleiques deposees couvrent les differents domaines retroviraux decrits ci-dessus, 
ainsi que les sequences contigues et les genes flanquants. Afin de detecter d'eventuels 

30 processus d'epissage alternatifs, des ADN specifiques sont synthetises par pas de 500- 
600 nucleotides avec un chevauchement de 250- 300 nucleotides de part et d' autre. 
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Les epissages altematifs deja identifies feront Tobjet d'une synthese specifique. 
L'hybridation s'effectue a l'aide d ; une sonde obtenue. par exemple, par retrotranspo- 
sition d'un melange d'ARN provenant de cellules, de tissus ou de liquides biologiques 
provenant de temoins reputes normaux, de membres de populations ethniques diffe- 
5 rentes, de patients atteints de pathologies souvent associees a une expression de retro- 
virus, comme les processus tumoraux, ou comme les maladies auto-immunes, dont la 
sclerose en plaques. Dans ce cas une fraction de jj.g et jusqu'a quelques fig d'ARNm 
ou jusqu'a quelques |ig ou dizaines de (ig d'ARN, selon la methode utilisee et la taille 
de la puce d'ADN concernee, sont suffisants pour la synthese de la sonde nucleique. 

10 La sonde nucleique est marquee de maniere adequate, afin d'autoriser une detection 
ulterieure, comme par exemple par fluorescence ou par une methode equivalents 

L'usage de sondes bi- } voire multicolores permet de preciser 
F expression concertee de plusieurs genes en parallele, en beneficiant de plus d'une 
normalisation precise. L' acquisition des resultats est effectuee automatiquement, 

1 5 comme par exemple par un sy steme de balayage laser ou son equivalent. 

Deux types de puces a ADN sont cogues, d'une part des puces 
presentant un ensemble exhaustif de sequences, et d' autre part des puces a ADN speci- 
fiques permettant un ciblage sur une application plus specifique. 

Par exemple, une sequence critique en ce qu'elle contiendrait une 

20 difference portant sur une deletion, voire une mutation, est detectee a raide 
d' oligonucleotides specifiques (Wang et coll., (1998), Science, 280, 1077- 1082). Le 
polymorphisme associe a une base ou a une mutation est detecte a Taide de quatre 
oligonucleotides possedant une des quatre possibilites de sequence au niveau d'une 
base (A, C G ou T): pour chaque difference ponctuelle les 4 oligonucleotides sont 

25 deposes et les intensites d'hybridation sont comparees. De plus, un epissage alternatif 
est detecte en utilisant des ADN correspondant a un seul exon effectif ou putatif : le 
gene est done analyse exon par exon. Les puces a ADN concernent aussi, par exten- 
sion, toute sequence retrovirale endogene ou exogene, comme par exemple ERV-9, 
ERV-K, ERV-L, ERV-H, ERV-4, ERV-6, ERV-8, ERV-10, ERV-15, ERV-16, ERV- 

30 17, ERV-18, ERV-21, ERV-24, ERV-33, ERV-34, ERV-36, ERV-40, ERV-42, ERV- 
MLN, ERV-FRD, ERV-FTD...), ainsi que toutes les sequences exoniques putatives 
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(identifies par F existence de sequences etiquettes et des transcrits correspondants) ou 
effectives, et qui sont situees de part et d'autre jusqu'a une distance de 120 kb des 
sequences retrovirales endogenes de type HERV-7q. 

L'etude comparative est menee entre un echantillon temoin et 
5 Techantillon a tester, dans une perspective prophylactique, diagnostique ou therapeu- 
tique, comme par exemple: la detection precoce d'une modification de F expression 
d'une des sequences, dans une cellule, un tissu ou un organisme, F identification d'une 
sequence associee a une susceptibilite ou a une pathologic quelconque, Ie suivi de 
revolution de la pathologie, ou encore le suivi d'un traitement et 1' evaluation de son 
10 efficacite. 

En dehors des applications deja enoncees, Finteret de la methode 
permet, d'une maniere plus generate, de faire un bilan des variations constatees chez 
un individu, ce qui constitue en quelque sorte une carte d'identite, ce qui facilite une 
approche epidemiologique permettant d'etablir de nouvelles correlations entre un 
1 5 profil particulier observe et une pathologie, en dehors de tout a priori concemant cette 
pathologie. 

La presente invention a egalement pour objet un kit de detection 
et/ou d'evaluation d'une maladie auto-immune et notamment des neuropathologies a 
etiologie auto-immune, caracterise en ce qu'il comprend outre les tampons necessaires 
20 k ia mise en oeuvre des procedes teis que dennis ci-dessus : 

- des reactifs A de diagnostic tels que definis ci-dessus, et 

- des reactifs B constitues par les transcrits et ADNc des sequences 
genomiques, qui codent pour tout ou partie d'un facteur, dont la fonction, la regula- 
tion/deregulation ou Falteration est associee a Fexpression normale ou pathologique 

25 ou k la regulation/deregulation de motifs appartenant a ladite famille HERV-7q, ces 
sequences correspondant a des sequences nucleotidiques codant pour des genes situes 
dans des regions flanquantes situees en amont et/ou en aval d'une sequence retrovirale 
de ladite famille HERV-7q dont Tune des extremites ne peut se trouver a une distance 
excedant 120 kb, 

30 lesquels reactifs sont de preference fixes sur un support approprie. 

Selon un mode de realisation avantageux dudit kit, lesdits reactifs B 
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sont selectionnes dans le groupe constitue par les sequences SEQ ID NO:62-67 et 1 19 
et leurs fragments correspondant a un cadre glissant superieur ou egal a 14 nucleotides 
ou leurs sequences complementaires, ainsi que les sequences representees aux figures 
13-17, 22-26. 

5 La presente invention a egalement pour objet des produits de traduc- 

tion, caracterisds en ce qu'iis sont codes par une sequence nucleotidique telle que 
definie ci-dessus. 

La presente invention a egalement pour objet un peptide, caracterise 
en ce qu'il est susceptible d'etre exprime a l'aide d'une sequence nucleotidique selec- 

10 tionnee dans le groupe constitue par les sequences SEQ ID NO: I -22, 28 et 61, telles 
que definies ci-dessus, selon les cornbinaisons offertes par Tusage des differents 
cadres de lecture possibles (voir egalement figures 18-21). 

Ledit peptide englobe egalement les peptides ou polypeptides deri- 
ves comprenant entre 5 et 540 aminoacides (SEQ ID NO:23-36 et SEQ ID NO:58 et 

15 leurs fragments d'au moins 5 aminoacides) et notamment un fragment de 538 amino- 
acides, commencant & la premiere methionine de la sequence SEQ ID NO:26 (enve- 
rine). 

Selon un mode de realisation avantageux desdits peptides, ils sont 
notamment selectionnes parmi les sequences SEQ ID NO:23-36, 58, notamment la 
20 sequence SEQ ID NO:26 et ses fragments C-terminaux ; soit a partir de i'acide amine 
291, soit a partir de Tacide amine 321, a compter de la premiere methionine. 

Selon un autre mode de realisation avantageux desdits peptides, ils 
sont obtenus a partir des sequences nucleiques telles que definies ci-dessus, dans 
lesquelles au moins un codon non-sens peut etre remplace par un codon codant pour 
25 Fun des aminoacides suivants : Phe (F), Leu (L), Ser (S), Tyr (Y), Cys (C), Trp (W), 
Gin (Q), Arg (R), Lys (K), Glu (E) ou Gly (G). 

L' invention englobe ainsi les peptides deduits ou les protetnes 
deduites correspondant a tout ou partie des sequences nucleiques decrites dans 
r invention, et presentant eventuellement des modifications avec les sequences de refe- 
30 rences decrites dans Tinvention, lorsqu'ils sont exprimes chez certains patients. En 
particulier, Tinvention englobe les sequences completes ou partielles obtenues selon 
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les 3 cadres de lecture sens et les 3 cadres de lecture inverses et complementaires. 

(voir figures 18-21) 

De maniere avantageuse, ['analyse de la structure du domaine env de 
HERV-7q, appele enverine, a permis de mettre successivement en evidence: 
5 - un peptide signal N-terminal (region 1- 21) et deux domaines 

transmembranes (region 320-340; 455-477), responsables d r interactions avec des 
motifs proteiques ou lipidiques membranaires, 

- un motif immunomodulateur de type CKS-17(Haraguchi et coll., 
(1995), 92, 5568- 5571)/ CKS-25. On peut noter a cet egard, la presence d*un motif 

10 RalD a I'interieur du peptide de type CKS-17/CKS-25 de HERV-7q et un motif RvaD 
en position 363 qui correspondent au consensus W/RxxD, propose pour le site actif 
des TGF-P (Huang et al., J. Biol. Chem., 1997, 272, 27155- 27159). de puissants 
facteurs associes a la croissance, a la differentiation et a la morphogenese et qui sont 
associes a de nombreuses pathologies humaines, comme les processus tumoraux 

15 (Tang et coll., (1998), Nat. Med., 4, 802- 807) ou les maladies neurodegeneratives 
(Flanders et coll, (1998), Prog. Neurobiol., 54, 71- 85). Les peptides selon Invention 
contenant ces motifs peuvent avantageusement servir d'antagonistes en inhibant la 
fixation des TGF- p sur leurs recepteurs naturels. 

- des motifs de N-glycosylation. La glycosylation des proteines 
20 d'enveloppe des retrovirus semble etre directement associee a ieurs proprietes fonc- 

tionnelles, pax exemple en influencant le nombre des determinants disponibles dans les 
cellules-T ou en favorisant la reconnaissance des antigenes par les cellules-T. La 
glycosylation pourrait jouer un role dans la declaration ou 1' extension d'une patholo- 
gie a incidence autoimmune. Les glycosylations sont necessaires au maintien de la 

25 conformation de certains epitopes, en particulier lors de la realisation d'une proteine 
d'enveloppe recombinante a fin de mise au point d'un reactif de diagnostic et pour 
favoriser Tefficacite d'un eventuel vaccin. Positions 171, 210, 216, 236, 244, 283 et 
411. Nombre prevu au hasard : 3.2 

. des sites de prenvlation . La prenylation est un mecanisme essentiel 

30 de la fixation a la membrane cellulaire et pour le ciblage de certaines proteines. Ce 
processus de ciblage pourrait etre essentiel pour Telaboration d'agents therapeutiques 
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specifiques aptes a interferer dans la realisation et la regulation du trafic de complexes 
cellulaires mettant en jeu des proteines impliquees dans les interactions, la croissance 
et les mouvements cellulaires. Positions 188 et 290. Nombre prevu au hasard ; 1.8 

- des sites de ciblage dans le reticulum endoplasmique . Ces sites 
permettraient d'assurer le ciblage vers le reticulum endoplasmique afin d'effectuer les 
modifications necessaires pour favoriser le franchissement membranaire. Positions 
3 53 et 43 1 . Nombre prevu au hasard : 0.2. 

Par ailleurs, les Inventeurs ont montre qu'un certain nombre de 
peptides issus de la proteine env de HERV-7q (envenne) presentent une affinite/demi- 
vie elevees pour des alleles HLA de classe I. Une analyse par CADD a permis de 
selectionner des peptides candidats, dont les meilleurs scores sont indiques dans le 
Tableau I: 

TABLEAU I 



5 locali- sequence 



molecule HLA 



score 



Sequence n c 





sation 


















399 


FLGEECCYYV 


A-0201 


7214 


SEQ 


ID 


NO: 


68 




462 


LLFGPCIFNL 


A-0201 


1792 


SEQ 


ID 


NO: 


69 


20 


189 


CLPLNFRPYV 


A-0201 


1453 


SEQ 


ID 


NO: 


70 




439 


GLLSQWMPWI 


A-0201 


488 


SEQ 


ID 


NO: 


71 




263 


CLPSGIFFV 


A-0201 


5103 


SEQ 


ID 


NO: 


72 




444 


WMPWILPFL 


A-0201 


897 


SEQ 


ID 


NO: 


73 




252 


IRWVTPPTQI 


B-2705 


3000 


SEQ 


ID 


NO: 


74 


25 


432 


LRNTGPWGLL 


B-2705 


2000 


SEQ 


ID 


NO: 


75 




158 


LRTHTRLVSL 


B-2705 


2000 


SEQ 


ID 


NO: 


76 




316 


KRVPILPFVI 


B-2705 


1800 


SEQ 


ID 


NO: 


77 




25 


CRCMTSSSPY 


B-2705 


1000 


SEQ 


ID 


NO: 


78 




137 


TRVHGTSSPY 


B-2705 


1000 


SEQ 


ID 


NO- 


79 


30 


124 


AREKHVKEVI 


B-2705 


600 


SEQ 


ID 


NO 


80 




478 


SRIEAVKLQM 


B-2705 


600 


SEQ 


ID 


NO 


81 




442 


SQWMPWILPF 


B-2705 


500 


SEQ 


ID 


NO 


:82 




405 


CYYVNQSGI 


Kd 


2400 


SEQ 


ID 


NO 


:83 




346 


FYYKLSQEL 


Kd 


2400 


SEQ 


ID 


NO 


:84 


35 


244 


TYTTNSQCI 


Kd 


2400 


SEQ 


ID 


NO 


:85 




291 


SFLVPPMTI 


Kd 


1600 


SEQ 


ID 


NO 


:86 




406 


YYVNQSGIV 


Kd 


1200 


SEQ 


ID 


NO 


:87 




167 


LFNTTLTGL 


Kd 


1152 


SEQ 


ID 


NO 


:88 




463 


LFGPCIFNL 


Kd 


960 


SEQ 


ID 


NO 


:89 


40 


253 


RWVTPPTQI 


Kd 


480 


SEQ 


ID 


NO 


:90 




449 


LPFLGPLAAI 


B-5102 


2200 


SEQ 


ID 


NO 


:91 




3 


LPYHIFLFTV 


B-5102 


1210 


SEQ 


ID 


NO 


:92 
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TABLEAU 1 (suite) 





locali- 


sequence 


molecule nLA 


score 


Van i i 


ence n° 




5 


sation 


















331 


GALGTGIGGI 


B-5102 


798 


SEQ 


ID 


NO: 


93 




321 


LPFVIGAGVL 


B-5102 


550 


SEQ 


ID 


NO: 


94 




499 


RRPLDRPAS 


B-2705 


600 


SEQ 


ID 


NO: 


95 


10 


194 


FRPYVSIPV 


B-2705 


600 


SEQ 


ID 


NO: 


96 




333 


RRALDLLTA 


B-2705 


600 


SEQ 


ID 


NO: 


97 




39 


WRMQRPGNI 


B-2705 


600 


SEQ 


ID 


NO: 


98 




423 


DRIQRRAEEL 


B14 


1800 


SEQ 


ID 


NO: 


99 




158 


LRTHTRLVSL 


B14 


600 


SEQ 


ID 


NO: 


100 


15 


359 


ERVADSLVTL 


B14 


540 


SEQ 


ID 


NO: 


101 




463 


LFGPCIFNLL 


Kd 


1658 


SEQ 


ID 


NO: 


102 




345 


QFYYKLSQEL 


Kd 


1152 


SEQ 


ID 


NO: 


103 




443 


QWMPWILPFL 


Kd 


691 


SEQ 


ID 


NO: 


104 




405 


CYYVNQSGIV 


Kd 


500 


SEQ 


ID 


NO: 


105 


20 


474 


NFVSSRIEAV 


Kd 


480 


SEQ 


ID 


NO: 


106 




221 


GPLVSNLEI 


B-5102 


1320 


SEQ 


ID 


NO: 


1 U / 




190 


LPLNFRPYV 


B-5102 


726 


SEQ 


ID 


NO: 


108 




449 


LPFLGPLAAI 


B-5101 


1144 


SEQ 


ID 


NO: 


109 




488 


EPKMQSKTKI 


B-5101 


968 


SEQ 


ID 


NO: 


110 


25 


3 


LPYHIFLFTV 


B-5101 


629 


SEQ 


ID 


NO: 


111 




125 


REKHVKEVI 


Kk 


1000 


SEQ 


ID 


NO: 


112 




312 


KPRNKRVPIL 


B7 


800 


SEQ 


ID 


NO: 


113 




378 


WLQNRRAL 


Db 


792 


SEQ 


ID 


NO: 


114 




377 


AWLQNRRAL 


Db 


660 


SEQ 


ID 


NO: 


115 


30 


321 


LPFVIGAGV 


B-5101 


629 


SEQ 


ID 


NO: 


116 




304 


DLYSYVISK 


A3 


540 


SEQ 


ID 


NO: 


117 




301 


TEQDLYSYVI 


Kk 


500 


SEQ 


ID 


NO: 


118 



Ce Tableau I indique une estimation de la demi-vie de dissociation 
35 d'un peptide de l'enverine avec un allele du systeme HLA de classe I (les tables de 
coefficients de Parker: J. Immunol, (1994), 152, 163- 175). La localisation indique la 
position du premier acide amine des peptides testes dans la sequence de 1'enverine. Le 
code a une lettre est utilise pour la sequence des acides amines. Les scores autour de 
500 ou superieurs a 500 ont ete retenus. A titre de comparaison, une analyse a ete 
40 effectuee sur une concatenation de peptides (polypeptide de 4968 acides amines) 
reputes pour fixer les molecules du complexe majeur d'histocompatibilite de classe 1 
(Rammensee, Immunogenetics, (1995), 41, 178- 228): les dix meilleurs scores enre- 
gistres pour des nonapeptides et le type HLA, A_0201 sont respectivement de 4984, 
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4047, 2406, 1267, 800, 705, 607, 591, 591 et 577. 

II ressort de ce Tableau 1 que certaines molecules du complexe 
majeur d'histocompatibilite de type I sont aptes a fixer des peptides issus de 
Tenverine, ainsi assimiles a des peptides d'origine virale ou tumorale. au niveau du 

5 reticulum endoplasmique. Les complexes formes au niveau du reticulum endo- 
plasmique sont alors transports a la surface cellulaire, ce qui entraine la destruction 
de la cellule cible par les lymphocytes-T cytotoxiques. Les peptides identifies 
component generalement 8 a 10 acides amines. Des etudes ont montre que certains 
alleles du systeme HLA de classe I sont ainsi associees a certaines pathologies, en 

10 particulier a caractere auto-immun, comme HLA-B27 avec la spondylarthrite ankylo- 
sante ou HLA-B5 1 avec la maladie de Beh9et. 

Un peptide apte a fixer une molecule particuliere de classe I est par 
consequent apte a fonctionner comme un epitope de cellule-T. 

En consequence, la presente invention inclut egalement les 

15 fragments 399-471 et 244-271 de Fenverine qui regroupent avantageusement plusieurs 
epitopes de forte affmite pour differents haplotypes du systeme HLA de classe I. 
L'usage de tout ou partie de ces polypeptides est en consequence apte a favoriser une 
augmentation du repertoire des cellules-T, en permettant une meilleure efficacite de la 
reponse immunitaire dans le cadre des differentes strategies immunotherapeutiques, 

20 prophylactique ou vaccinales). Ces peptides pourront etre avantageusement delivres 
par exemple par l'usage, de vecteurs viraux, de particules virales ou synthetiques, de 
lipopeptides, d'adjuvants classiques, d'acides nucieiques nus ou adsorbes sur des 
particules, ou de liposomes. 

Au sens de la presente invention, les peptides peuvent etre chimi- 

25 quement ou biochimiquement modifies ; certaines des acides amines peuvent etre 
remplaces par un acide amine analogue, selon les criteres classiques d'homologies (A 
ouG ;SouT;I,LouV;F, Y ou W ; N ou Q ; D ou E). 

La presente invention a egalement pour objet des compositions 
immunog^nes ou vaccinales, pour la protection contre les maladies auto-immunes, 

30 notamment chez les sujets a risque, caracterisee en ce qu'elle comprend au moins un 
peptide comprenant au moins un motif de type CKS et/ou au moins un peptide 
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constitue par un motif presentant une affinite avec Tun des haplotypes du systeme 
HLA de classe I ou de classe II et un vehicule pharmaceutiquement acceptable. 

Selon un mode de realisation avantageux de ladite composition, ledit 
motif est selectionne dans le groupe constitue par les peptides tels que definis dans le 
5 Tableau I ci-dessus. 

Selon un autre mode de realisation avantageux de ladite composi- 
tion, ledit peptide presente la sequence suivante : 

sequence CKH: LONRRALDLLTAERGGT clFLGEECCYYV 

(SEQ ID NO:120). 

10 II est remarquable de constater au niveau de la position 380 de la 

proteine enverine, la contigui'te des motifs de type CKS-17 (souligne) et du peptide 
presentant le score le plus eleve (en gras ; voir peptide en position 399 dans le Tableau 
I, SEQ ID NO:68) dans la sequence CKH. 

1/ activation clonale des sous-groupes de lymphocytes, par exemple 

15 de lymphocytes cytotoxiques, par les peptides du Tableau I et par extension leurs 
homologues, est bloquee par des manoeuvres usuelles d'immunotherapie comme par 
exemple la serotherapie et la vaccination. 

L'association de deux sequences ou des sequences analogues au 
peptide CKH (SEQ ID NO: 120), est a meme d'entrainer un processus synergique dans 

20 la reponse immunitaire, qui pourrait rnettre en jeu des voies de signalisation et 
d'activation complementaires, aptes a moduler l'activation lymphocytaire. 

La vaccination concerne la production d'anticorps diriges contre les 
peptides du tableau I, selon les regies de Tart et selon les methodes de liberation 
controlees par implants artificiels ou cellulaires mettant en oeuvre une composition 

25 telle que definie ci-dessus et par usage des manoeuvres de therapie genique, comme 
par exemple par expression des sequences nucleiques codant pour les peptides du 
Tableau I. En consequence l'invention a egalement pour objet des compositions 
immunog6nes ou vaccinale caracterisee en ce qu'elles comprennent un vecteur 
incluant au moins une sequence nucleique codant un peptide tel que defini dans le 

30 Tableau I, eventuellement associee a une sequence codant un motif de type CKS- 1 7. 

La serotherapie concerne Tutilisation d'anticorps neutralisants 
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produits a partir des peptides du Tableau I et leurs homologues. 

Les produits proteiques generes par les sequences retrov.rales endo- 
genes ou produits parallelement peuvent avantageusement etre caracterises par des 
micro-methodes d'analyse et de quantification des peptides et des protemes: 
5 HPLC/FPLC ou equivalent, electrophone capillaire ou equivalent, techniques de 
microsequencages (methode d'Edman ou eqmvalent, spectrometrie de masse...)- 

L'invention a egalement pour objet des anticorps diriges contre 1 un 
ou plusieurs des peptides decrits c.-dessus et leur utilisation sou pour la mise en «uvre 
d-une methode de detection in vitro, notamment difference de la presence d'une 
10 telle sequence chez un individu, soit pour la preparation d'une composite apte a etre 
utilisee en serotherapie dans les neuropathologies a composante auto-.mmune. 

Lesdits anticorps sont avantageusement des anticorps polyclonaux 
ou monoclonaux obtenus par une reaction immunologique d'un orgamsme humain, 
mammiferes, oiseaux ou autres especes vis-a-vis des proteines, telles que defimes c, 
15 dessus. 

La presente invention a pour objet un procede de dernstage 
immunologique differentiel de sequences retroviral endogenes humaines de la 
famille HERV-7q normales ou pathologies, caracterise en ce qu'il comprend la rmse 
en contact d'un echantillon biologique avec un anticorps selon Invention, la lecture 
20 du result* etant revelee par un moyen approprie, notamment E1A, ELISA, RIA, 
fluorescence. 

A titre d'illustration, une telle methode de diagnostic in vitro selon 
l'invention comprend la mise en contact d'un echantillon biologique preleve chez un 
patient, avec des anticorps selon l'invention et la detection a I'aide de tout procede 
25 approprie, notamment a I'aide d'anu-immunoglobulines marquee, des complexes 
immunologies formes entre les proteines produites normalement ou pathology- 

ment et les anticorps. 

Des anticorps monoclonaux ou polyclonaux, produits a parbr 

d'antigenes corresponds a des peptides de synthese, de polypeptide ou proteines 

30 recombinants, permettent de suivre .'expression des peptides ou proteines prodmts 

normalement ou pathologiquement. L'analyse est de preference effectuee par ELISA, 
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ou equivalent, Western-blot ou equivalent, ou par immunohistochimie. 

Les peptides ou proteines, issus des sequences retrovirales endo- 
genes ou dont 1' expression est associee a 1' expression de ces sequences retrovirales 

endogenes, sont recherches et identifies. 
5 La presente invention a egalement pour objet un precede d'identifi- 

cation et de detection de motifs retroviraux endogenes, anormalement exprimes dans 
le cadre de pathologies associees au cancer, ou de neuropathologies en particulier 
auto-immunes, au premier rang desquelles la sclerose en plaques, caracterise en ce 
qu'U comprend l'analyse comparee des sequences extraites d'un echant.llon biologique 

1 0 avec les sequences selon l'invention. 

La presente invention a egalement pour objet ('application des 
sequences nucleiques ou des sequences proteiques selon l'invention au diagnostic, au 
pronostic, a revaluation de la susceptibilite genetique, a toutes maladies humaines 
induites, innees ou acquises en particulier celles a composantes cancereuses, auto- 

15 immunes et/ou a incidence neurologique, comme la sclerose en plaques, les 
syndromes associes et les maladies neurodegeneratives oil intervient tout ou partie des 
sequences nucleiques selon l'invention et des formes endogenes ou exogenes appa- 
rentees. 

La presente invention a egalement pour objet des sequences 
20 nucleiques hybrides, caracterisees en ce qu'elles comprennent des sequences ou motifs 
nucleiques selon l'invention, combines avec des sequences ou motifs d'origine endo- 
gene ou d'origine ou induits de maniere exogene. 

La presente invention a, en outre, pour objet un vecteur recombinant 
de clonage ou depression, caracterise en ce qu'il comprend une sequence nucleique 

25 conforme a l'invention. 

Des manoeuvres therapeutiques peuvent etre envisagees par usage de 
certaines des sequences nucleiques contenues dans HERV-7q et les sequences de la 
meme famille ou des structures polypeptidiques deduites ou par utilisation de peptides 

ou proteines, ou d'anticorps specifiques. 
30 Conformement i 1' invention, tout ou partie des sequences nucleiques 

retrovirales endogenes de type HERV-7q, peut etre utilisee a usage de vecteur ou 
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d'elements de vecteurs a vocation therapeutique, en particulier les sequences LTR et la 

region gag (SEQ ID NO :2, 21 et 22).. 

L'interet de telles sequences reside, dans I'innocuite du vecteur ainsi 
forme, dans la possibility d'une insertion specifique ciblee dans une region bien defi- 

5 nie par une strategic analogue a la recombinaison homologue, dans le ciblage cellu- 
laire, eventuellement transitoire dans le cas d'une expression placentaire chez la 
femme. Un autre aspect concerne la possibilite d'associer aux genes dmterets les 
motifs retroviraux biologiquement actifs (peptides immunomodulateurs, tels que 
represents aux sequences SEQ ID NO 68-1 18, ci-apres, peptide fusogene...). 

10 La presente invention a egalement pour objet des animaux 

transgeniques, caracterises en ce qu'ils comprennent tout ou partie d'une sequence de 
type HERV-7q (SEQ ID NO: 1-22 et 61). 

Le Tableau II ci-apres etablit les correspondances entre les numeros 
des sequences telles qu'elles apparaissent dans la liste de sequences et le nom des 

15 differentes sequences. 

TABLEAU II 



SEQ ID NO : 


DESIGNATION 


1 


Acide nucleique : 7 env 


2 


Acide nucleique : gag 


3 


Acide nucleique : HERV-7q 


4 


Acide nucleique : HE2 


5 


Acide nucleique : HE3 


6 


Acide nucleique : HG3 


7 


Acide nucleique : HE4 


8 


Acide nucleique : HE5 


9 


Acide nucleique : HE6 


10 


Acide nucleique : HG6 


11 


Acide nucleique : HE7 


12 


Acide nucleique : HE8 


13 


Acide nucleique : HG8 


14 


Acide nucleique : HE9 


15 


Acide nucleique : HE 10 


16 


Acide nucleique : HE1 1 


17 


Acide nucleique : HG1 1 


18 


Acide nucleique : HE 12 


19 


Acide nucleiaue : HG12 
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SEQ ID NO: 


DESIGNATION 


20 


Acide nucleique : Rl 


21 


Acide nucleique : R1F 


22 


Acide nucleique + proteine env deduite : HbRV-/q 


23 


Fragment de proteine env deduite selon SEQ ID NO :22 


24 


Fragment de proteine env deduite selon SEQ ID NO :22 


25 


Fragment de proteine env deduite selon SEQ ID NO :22 


26 


Proteine : enverine 


27 


Fragment de proteine env deduite selon SEQ ID NO \ll 


28 


Acide nucleique + proteine deduite de gag : HERV-7q 


29 


Fragment de proteine gag deduite selon SEQ ID NO :28 


30 


Fragment de proteine gag deduite selon SEQ ID NO :28 


31 


Fragment de proteine gag deduite selon SEQ ID NO :28 


32 


Fragment de proteine gag deduite selon SEQ ID NO :28 


33 


Fragment de proteine gag deduite selon SEQ ID NO .28 


34 


Fragment de proteine gag deduite selon SEQ ID NO .28 


35 


Proteme env : cadre de lecture l 


36 


Proteine gag 


37 


Acide nucleique : GIF (amorce) 


38 


Acide nucleique : GIR (amorce) 


39 


Acide nucleique : G2F (amorce) 


40 


Acide nucleique : G2R (amorce) 


41 


Acide nucleique : G4F (amorce) 


42 


Acide nucleique : G3F (amorce) 


43 


Acide nucleique : G4R (amorce) 


44 


Acide nucleique : GSR (amorce) 


45 


Acide nucleique : EIF (amorce) 


46 


Acide nucleique : EIR (amorce) 


47 


Acide nucleique : E2F (amorce) 


48 


Acide nucl&que : E2R (amorce) 


49 


Acide nucleique : E3F (amorce) 


50 


Acide nucleique : E3R (amorce) 


51 


Acide nucleique : E4F (amorce) 


52 


Acide nucleique : E4R (amorce) 


53 


Acide nucleique : E5F (amorce) 


54 


Acide nucleique : E6F (amorce) 


55 


Acide nucleique . cjK. ^amorcej 


56 


Acide nucleique : ExF (amorce) 


57 


Acide nucleique : ExR (amorce) 


58 


Proteine gag 


59 


Acide nucleique : Sequence A (sequence d' insertion) 


60 


Acide nucleique : Sequence B (sequence d' insertion) 


61 


Acide nucleique : HE 13 


62 


Acide nucleique : RH7 
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SEQ ID NO: 




DESIGNATION 


63 


Acide nucleique . 


RAM75 


64 


Acide nucleique 


RAV73 


65 


Acide nucleique 


RBP3 


66 


Acide nucleique 


HI3 


67 


Acide nucleique 


LTX 


68 


Peptide Tableau 1 




69 


Peptide Tableau 1 




70 


Peptide Tableau 1 




71 


Peptide Tableau ] 




72 


Peptide Tableau 1 




73 


Peptide Tableau 1 




74 


Peptide Tableau 1 




75 


Peptide Tableau 1 




76 


Peptide Tableau I 




77 


Peptide Tableau 1 




78 


Peptide Tableau 1 




79 


Peptide Tableau 1 




80 


Peptide Tableau ] 




81 


Peptide Tableau 1 




82 


Peptide Tableau ] 




83 


Peptide Tableau ] 




84 


Peptide Tableau ] 




85 


Peptide Tableau 1 




86 


Peptide Tableau 1 




87 


Peptide Tableau 1 




88 


Peptide Tableau I 




89 


Peptide Tableau 1 




90 


Peptide Tableau ] 




91 


Peptide Tableau 1 




92 


Peptide Tableau 1 




93 


Peptide Tableau 1 




94 


Peptide Tableau 1 




95 


Peptide Tableau 1 




96 


Peptide Tableau 1 




97 


Peptide Tableau 1 




98 


Peptide Tableau ] 




99 


Peptide Tableau 1 




100 


Peptide Tableau 1 




101 


Peptide Tableau 1 




102 


Peptide Tableau ] 




103 


Peptide Tableau '. 




104 


Peptide Tableau 1 




105 


Peptide Tableau ] 
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1 C\A 
1U0 


Peptide labieau I 


CPA TTV lKir\. 

bhji} ID NO: 


DESIGNATION 


1 fV7 


Peptide Tableau I 


i no 


Peptide Tableau I 


109 


Peptide Tableau I 


1 1 A 

110 


Peptide Tableau I 


111 

111 


Peptide Tableau I 


1 12 


Peptide Tableau I 


1 1 ^ 
113 


Peptide Tableau I 


114 


Peptide Tableau I 


i i j 


reptiae i aoieau i 


116 


Peptide Tableau I 


117 


Peptide Tableau I 


118 


Peptide Tableau I 


119 


Acide nucleique : BLIMP- 1 


120 


Peptide : CKH 


121 


Acide nucleique : F645 (amorce) 


122 


Acide nucleique : PS5D (amorce) 



Outre les dispositions qui precedent, V invention comprend encore 
d'autres dispositions, qui ressortiront de la description qui va suivre, qui se refere a 
des exemples de mise en ceuvre du procede objet de ia presente invention ainsi qu'aux 
5 dessins annexes, dans lesquels : 

- Figure 1. Sequence nucleique humaine HERV-7q, dont F analyse et 
le traitement permettent de caracteriser une nouvelle structure retro virale endogene. 
Les regions nucleiques repetees de type Rl et R2 et les domaines gag t pol et env sont 
soulignes. Les domaine de type gag et env sont en italiques. La region homologue a 

10 une partie 3' non-codante de Rab7 est doublement soulignee. 

- Figure 2. Cartographie de la region retroviral endogene humaine 
HERV-7q. La partie haute de la figure correspond a une region anonyme du genome 
humain situee sur le bras long du chromosome 7. On peut identifier les domaines 
rdpetes (1), gag (2\pol (3) et env (4) de HERV-7q. La region env C-terminale (4.3) se 

15 prolonge en amont en un long cadre de lecture ouvert (4.2). Le domaine 4.1, corres- 
pond a la region N-terminale du domaine env. 

- Figure 3. Comparaison des sequences nucleiques repetees situees 
aux bornes de HERV-7q. Les regions nucleiques repetees 5'(haut) et 3'(bas), sont 
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comparees et les bases identiques sont indiquees par deux points. 

- Figure 4. Sequence deduite presentant un cadre de lecture ouvert. 
dans le domaine de type-env de HERV-7q selon la regie du plus long cadre de lecture 
ouvert. 

5 - Figure 5. Sequences autour du domaine CKS-17 identifiees dans 

differents domaines env deduits de la famille de HERV-7q et comparaison avec des 
motifs CKS-17 de reference. 

1) HE2 - 2) HERV-7q - 3) N° d'acces a GenBank: M85205 - 4) 
HE7 - 5) HE9 - 6) CKS-17: le motif peptidique doue de proprietes immunomodula- 
1 0 trices est souligne - 7) gp20 de retrovirus de type-D (SRV-Pc). 

- Figure 6. Sequence deduite possible du domaine de type-gag iden- 
tifie dans HERV-7q etablie selon la regie du plus long cadre de lecture ouvert. X et / 
correspondent respectivement a un codon non-sens et a un decalage de cadre de 
lecture. La sequence soulignee correspond au debut du domaine poi 

15 - Figure 7. Comparaison des regions nucleiques couvrant la region 

gag de HERV-7q (haut) et HERV-TcR (bas) et leurs regions flanquantes. Les bases 
identiques sont specifiees par deux points. 

- Figure 8. Exemple d'alignements nucleiques du domaine de type 
env de HERV-7q avec des domaines de type env similaires presents dans des 

20 sequences retrovirales endogenes humaines de la meme famille. Les codons non sens 
sont soulignes : 1) HERV-7q - 2) HE2 - 03) HE3 - 04) HE4. 

- Figure 9. Alignements nucleiques entre le domaine gag de HERV- 
7q et les domaines correspondants appartenant a la meme famille. Comparaison avec 
des fragments de domaines gag isoles d'agents retroviraux infectieux. Sequences 

25 d'origine retrovirale infectieuse: N° d 1 accession dans la banque de donnees EMBL : 
1 ) A60 1 68 - 2) A6020 1 - 3) A60200 - 4) A60 1 7 1 . Sequences retrovirales endogenes 
humaines: 5) HERV-7q - 6) HG1 1 - 1) HG3. Les chiffres indiques dans les sequences 
endogdnes, correspondent au nombre de nucleotides inseres afin d'optimiser 
Talignement avec les sequences de type gag identifiees dans des retrovirus d'origine 

30 infectieuse. 

- Figure 10. Alignement d'un motif gag proteique deduit (haut) 
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appartenant a un retrovirus infectieux (N° d'accession EMBL : A60200) avec le motif 
gag proteique deduit (bas) identifie dans HERV-7q. Les codons non-sens sont en gras 
et soulignes. Les acides amines identiques sont specifies par 2 tirets. Un tiret indique 
une deletion ou un acide amine homologue. 
5 - Figure 11. Alignement d'un motif env (haut) appartenant a un 

retrovirus infectieux (N° d'accession EMBL : A60170) avec le motif env (bas) identi- 
fie dans HERV-7q. Les nucleotides homologues sont specifies par deux points et les 
deletions par un tiret. 

- Figure 12. Comparaison entre le domaine env de HERV-7q (haut) 
10 et le domaine env de HERV-9 (bas). L'homologie de 66 % se limite a la region 3" du 

domaine env de HERV-7q et HERV-9, respectivement entre les nucleotides 8976 nt et 
9500 nt de HERV-7q et les nucleotides 2898 nt et 3465 nt de HERV-9 (N° 
d'accession k GenBank : X57147). De nombreuses insertions/deletions sont aussi 
observees. 

15 - Figure 13. Homologie entre une partie de la sequence du transcrit 

codant pour RH7 (haut, SEQ ID NO:62) et un motif de RGH2 (bas - N° d'accession a 
GenBank: D11018). 

- Figure 14. Identification de la sequence du transcrit codant pour 
RAM75 (SEQ ID NO:63), correspondant au gene d'une ATPase de type PEX1. Les 

20 exons codants sont soulignes. Les codons d' initiation ei non-sens ainsi que les sites 
putatifs de polyadenylation sont en gras et soulignes. La region en italique correspond 
au debut de la sequence retrovirale endogene RH7. 

- Figure 15. Sequence du transcrit codant pour RAV73 (SEQ ID 
NO:64), situee a 0.7 kb en aval de HERV-7q ; les sequences nucleiques aptes a coder 

25 pour un ou plusieurs polypeptides sont soulignees. 

- Figure 16. Comparaison entre la sequence LTR 3' (haut) de 
HERV-7q et la sequence intronique LTX (SEQ ID NO:67), situee dans le gene FMR2, 
associe au X-fragile (bas). 

- Figure 17. Mise en evidence de modifications sur la sequence 
30 nucleotidique (ID NO:3), chez des patients atteints de SEP. Les bases modifiees, chez 

au moins un patient, sont soulignees. Les amorces utilisees sont en italiques 
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(sequences SEQ ID NO: 121 et 122). L'ATG d' initiation et le codon non-sens sont en 
gras. 

- Figure 18. Partie codante env de la sequence HERV-7q (sequence 
ID NO:3), avec 3 cadres de lecture. 

- Figures 19, 20, 21. Presentation separee de la proteine env selon les 
3 cadres de lecture. 

- Figure 22. Sequence nucleique contenant la sequence retroviral 
RH7 situee en 5' de la sequence HERV-7q. La sequence en italique correspond au 
debut de la sequence HERV-7q. La sequence RH7 est soulignee. Deux sites de poly- 
adenylation putatifs sont gras. 

- Figure 23. Sequence du transcrit codant pour RJBP3 contenant des 
motifs nucleotidiques identifies dans la sequence nucleique codant pour le gene 
Blimp- 1. 

- Figure 24. Sequence du transcrit codant pour APS, 

- Figure 25. Sequence du transcrit codant pour Blimp-1 ; la partie 
codante est soulignee ; les codons d'initiation et de terminaison sont en gras. 

- Figure 26. Sequence du transcrit codant pour FMR2. La partie 
codante est soulignee. Les codons d'initiation et non-sens sont en gras. 

II doit etre bien entendu, toutefois, que ces exemples sont donnes 
uniquement a titre d'illustration de Tobjet de I'invention, dont ils ne constituent en 
aucune maniere une limitation. 

EXEMPLE 1 : Detection, par amplification genique, d'une sequence nucleique 
appartenant a un domaine de type gag ou env selon l'invention, dans un echan- 
tillon d'ADN glnomique d'origine humaine ou de mammiferes. 

L'amplification genique s'effectue a partir d'ADN genomique isole 
a partir du sang. Un traitement anticoagulant est effectue avec 1 ml d'une solution de 
citrate (pour un litre : 4,8 g de d'acide citrique, 13,2 g de citrate de sodium, 14,7 g de 
glucose) pour 6 ml de sang frais. Apres centrifugation de 20 ml de sang pendant 15 
mn a 13.0000 g, le sumageant est elimine et la fraction enrichie en globules blancs est 
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transferee dans un nouveau tube, puis recentrifugee dans les memes conditions que 
precedemment. La fraction enrichie en globules blancs est resuspendue dans un 
tampon d'extraction (10 nm Tris-HCl, 0,1 M EDTA, 20 u-g/ml de RNAse pancreatique 
traitee afin d'eliminer les DNAses. 0,5 % SDS, pH 8.0). puis incubee pendant 1 heure 
5 a 37°C. La proteinase K est ajoutee a une concentration finale de 100 ug/ml. La 
suspension des cellules lysees est incubee a 50°C durant 3 heures sous agitation perio- 
dique, puis traitee par un volume egal de phenol equilibre par du Tris-HCl 0.5 M, pH 
8,0. L'emulsion formee est placee sur une roue pendant une heure, puis centrifugee a 
5000 g pendant 15 mn a temperature ambiante. La solution aqueuse est traitee depro- 

10 teinise par une triple extraction phenolique afin d'obtenir un niveau de purification 
correspondant a un rapport final d'absorbance A260/A280 superieur a 1.75. La frac- 
tion aqueuse est precipitee par 0,2 vol. d'acetate de sodium 10 M et 2 vol. d'ethanol. 
L'ADN est alors soit preleve avec l'extremite d'une pipette pasteur recourbee ? soit 
centrifuge a 5000 g pendant 5 mn a temperature ambiante. L'ADN ou le culot d'ADN 

15 est lave deux fois par de Fethanol a 70 %, puis repris dans 1 ml de TE pH 8.0 afin 
d'etre elue sous agitation douce pendant 12 a 24 heures. 

Des oligonucleotides specifiques des sequences endogenes decrites 
selon Tinvention sont choisis pour amplifier la region gag ou env des regions retro- 
virales endogenes decrites selon Tinvention. L'ADN genomique etudie provient de 

20 patients presentant des pathologies comme la sclerose en plaques et d'individus repu- 
tes sains. 

Les ADN polymerases thermostables utilisees ont ete choisies pour 
leur grande fidelite lors du processus d'amplification, comme la Vent r ADN polyme- 
rase (Biolabs) ou equivalent, et sont utilisees selon les conditions preconisees par le 
25 fournisseur. 

La strategic d 1 amplification utilise selon les cas une simple PCR, ou 
une PCR nichee ou semi-nichee. 

Oligonucleotides utilises pour amplifier la region gag : 

- amorce GIF, sens, localtsee dans la region amont du domaine gag 
30 de HERV-7q (SEQ ID NO:37), 

- amorce G1R, anti-sens, localisee dans la region 3' terminate du 
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domaine gag (SEQ ID NO:38), 

Le fragment de 1505 nt amplifie par le couple G1F-G1R : 1505 nt 
est utilise afin de generer les sondes aptes a hybrider les differents produits 
d'amplification des PCR. 
5 - amorce G2F, sens nichee (SEQ ID NO:39), 

- amorce G2R, anti-sens nichee (SEQ ID NO:40), 

- amorce G4F, sens nichee (SEQ ID NO:41), 

- amorce G3F, sens nichee (SEQ ID NO:42). 

- amorce G4R, anti-sens nichee (SEQ ID NO:43), 
10 - amorce G5R, anti-sens nichee (SEQ ID NO:44). 

Oligonucleotides utilises pour amplifier la region env de HERV-7q : 

- amorce E1F, sens (SEQ ID NO:45), 

- amorce E1R, anti-sens (SEQ ID NO:46), 

Le fragment de 2529 nt amplifie par le couple d'amorces E1F-E1R, 
15 est utilise afin de generer les sondes aptes a hybrider les differents produits 
d 1 amplification des PCR. 

- amorce E2F, sens (SEQ ID NO:47), 

- amorce E2R, antisens (SEQ ID NO:48), 

- amorce E3F, sens (SEQ ID NO:49), 

20 - amorce E3R, anti-sens (SEQ ID NO:50), 

- amorce E4F, sens (SEQ ID NO:51), 

- amorce E4R, anti-sens (SEQ ID NO:52), 

- amorce E5F, sens (SEQ ID NO:53), 

- amorce E6F, sens(SEQ ID NO:54) 
25 - amorce E5R(SEQ ID NO:55). 

-amorce ExF (SEQ IDNO:56) 

- amorce ExR (SEQ ID NO:57) 

La PCR est realisee a partir de 50 a 200 ng d'ADN genomique. Les 
conditions de PCR sont celles preconisees par le fournisseur. Les conditions cycliques 
30 d'amplification sont realisees dans 50 ^1 : une denaturation de 94°C pendant 1 min., 
une hybridation de 70°C pendant 1 min., et une elongation a 72 °C pendant 1 a 2 min., 
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selon les fragments amplifies. Apres 35 cycles, une reaction terminale est menee a 
72°C pendant 10 min. Le sequence automatique des echantillons amplifies est rea- 
lise a Faide d'un sequenceur Applied Biosystems de type ABI 377 ou autre modele 
comparable, selon les protocoles fournis par le constructeur. 

5 Dans le cas d'une PCR nichee ou semi-nichee. les memes conditions 

experimentales sont utilisees, a la seule difference que P echantillon d'ADN geno- 
mique est remplace par 5 a 10 ul du produit d 1 amplification issu de la premiere PCR. 

Deux amplifications independantes sont realisees a partir du meme 
echantillon. Une reaction de controle est realisee en remplaqant F echantillon d'ADN 

10 par de Feau afin de detecter d'eventuels contaminants. 

EXEMPLE 2 : Detection par amplification genique d'une sequence nucleique 
selon Finvention dans un echantillon biologique d'ADN genomique preleve chez 
des patients presentant une pathologie candidate declaree ou la suspicion de cette 
pathologic 

15 Le protocole d'amplification est le meme que dans Fexemple L mis 

a part Forigine de fechantillon qui provient de patients presentant une pathologie 
candidate. Un echantillon d'ADN genomique repute normal est systematiquement 
integre dans l'ensemble des echantillons pathologiques amplifies puis analyses. 

Les produits de PCR sont separes sur un gel d'agarose a 1 ,5 %, puis 

20 transferes en presence de soude 0,4 N sur une membrane de nylon charge. Une hybri- 
dation est realisee avec une sonde specifique correspondant aux fragments de PCR 
amplifies soit par les couples G1F-G1R soit par le couple E1F-E1R. La sonde est 
marquee par incorporation de dUTP-digoxygenine selon le protocole du fournisseur 
(Boehringer Mannheim). L 'hybridation est effectuee dans un tampon d' hybridation 

25 (5XSSC, 50 % fonnamide, 0,1 % lauroyl-sarcosine, 0,02 % SDS, 2 % de reactif de 
blocage Boehringer) pendant une nuit a 42°C. Le Southern est lave 2 fois 5 min. a 
temperature ambiante dans une solution de 2XSSC, 0,1% SDS. Puis un lavage a haute 
stringence est effectue a deux reprises pendant 15 min. a 55°C dans une solution 
0,1XSSC, 0,1 % SDS. L'hybridation est revelee selon le protocole du fournisseur 

30 (Boehringer Mannheim), en presence d'un substrat chimioluminescent de la phospha- 
tase alcaline, de type CSPD ou CDP-STAR. Le filtre est revele apres une exposition 
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de 1 5min. a 60 min. 

Une analyse par SSCP (" single strand conformation polymor- 
phism ") permet de detecter des modifications discretes de la sequence des fragments 
amplifies par PCR. La PCR est menee en presence de dCTP marques au P». L'echan- 
5 tillon a analyser est denature a 95°C pendant 10 min., en presence de tampon de 
charge, puis immediatement charge sur un gel de polyacrylamide a 10%, contenant 
7.5% de glycerol. La migration s'effectue a 4°C a 8-10 W. Le gel est seche puis auto- 
radiographic. 

Les fragments de PCR susceptibles de presenter une alteration de 
1 0 leur sequence nucleotidique sont sequences selon I'exemple 1 . 

Une hybridation a 1'aide d'un oligonucleotide specifique (17 mers a 
20 mers) correspondant a la region nucleotidique modifiee permet d'identifier les 
echantillons presentant une modification identique (methode ASO). Brievement le 
southern est hybride avec un oligonucleotide marque distalement soil au P» soit en 
15 presence de digoxygenine (selon le protocole de Boehringer Mannheim) puis lave 
dans des conditions stringentes a 65%C dans une solution 6XSSC, 0.05% pyrophos- 
phate de sodium. 

Par exemple, un sequencage nucleotidique automatique a ete realise 
sur six fragments de PCR, provenant de 5 patients atteints de SEP et un temoin repute 

20 normal, et qui ont ete amplifies a partir des amorces F645: 
CTTCAAACAACAACCAGGAGG (SEQ ID NO: 121) (situee a 26 nucleotides en 
amont de la methionine d'initiation de renverine) et PS5D: 
TTGGGGAGGTTGGCCGACGA (SEQ ID NO: 122) (situee a 6 nucleotides en aval 
du codon non-sens de renverine. Des modifications de la sequence de l'enverine ont 

25 ete observes sur l'ADN de certains des patients (figure 1 7). 

EXEMPLE 3 : Detection d'une proteine selon l'invention dans un echantillon 

biologique. 

- Preparation d'une fraction proteique purifiee de liquide cephalo- 

rachidien de patients atteints de SEP 
30 Apres un traitement a 56°C pendant 30 min, et elimination des 

immunoglobulines sur une colonne de proteine G HiTrap (Pharmacia), Tequivalent de 
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10 ml de LCR est depose sur une colonne de DEAE Sepharose CL-6B (Pharmacia). 
L/elution est realisee en Tns-HCl 20 mM pH 8,8, et un gradient de 0 a 0,4 M de NaCL 
puis la fraction est dialysee 2 fois contre du tampon phosphate-NaCl (PBS). Apres 
concentration sur Ultrafree-MC (Millipore), la fraction est deposee sur une colonne de 
5 Superose 12 (FPLC Pharmacia) et eluee en presence de PBS. Apres separation par 
electrophorese en gel de polyacrylamide-SDS, et electo-transfert sur une membrane 
d'Immobilon-P (Millipore), les bandes proteiques sont soumises a une hydrolyse 

trypsique menagee. 

- Analyse de la fraction proteique par spectrometrie de masse 
10 Les peptides digeres en presence de trypsine, sont analyses par la 

methode de MALDI-TOF, qui permet 1'analyse de peptides presents en melange. 
(COTTRELL J.S., Pept. Res., 1997, 7, 1 15-124). Les peptides caracterises en fonction 
de leur masse sont compares aux proteines et aux proteines associees selon 
T invention. 

15 EXEMPLE 4 : Detection d'anticorps specifiques anti-domaine env de HERV-7q. 

L'identification d'un long cadre de lecture ouvert au sein de la 
sequence env de HERV-7q, a permis de determiner une sequence proteique deduite 
SEQ ID NO:22 et 35 et figures 18-20 d'une region dudit gene. 

Les sequences de proteines deduites des sequences ID NO:22, 35 et 
20 des figures 18-20 sont positionnees comme suit par rapport a la figure 1 ou a la 

sequence ID NO:3 : 

SEQ ID NO:22 (cadre de lecture I) et figure 19 : debut de la 
sequence codante : position 7874, fin de la sequence codante l ff codon non-sens 
(position 9493) 

25 SEQ ID NO:35 : debut de la sequence codante : position 7874, fin de 

la sequence codante 1 CT codon non-sens (position 9493) (cadre de lecture 1) 

Figure 19 : debut de la sequence codante : position 6970, fin de la 
sequence codante I* codon non-sens (position 9493) (cadre de lecture 1) 

Figure 20 : debut de la sequence codante : position 6971, la fin du 
30 cadre de lecture est d&alee selon le cas de 1 , 2 ou 3 codons 

Figure 21 : debut de la sequence codante : position 6972, la fin du 
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cadre de lecture est decalee selon le cas de 1 f 2 ou 3 codons 

Different peptides correspondant a tout ou partie des SEQ ID 
NO:22 (voir SEQ ID NO:23-27 et 35) ont ete synlhetises par genie genetique afin de 
tester leur specificite antigenique vis-a-vis de sera ou de tissus de patients atteints de 
5 SEP, par exemple. Brievement, tout ou partie de la region env de HERV-7q est sous 
clonee dans les vecteurs pQE30, 31 et 32. Les vecteurs pQE30. 31 et 32 contiennent 
en 5' du multi-site de clonage les sequences consensuelies pour la transcription (le 
promoteur fort du bacteriophage T5, 2 operateurs de l'operon lactose), la traduction 
(un site d'accrochage ribosomal synthetique). De meme, pQE30, 31 et 32 possedent en 
10 3', le terminateur de transcription du phage 1 ainsi qu'un codon "Stop" pour la traduc- 
tion, [/expression de la proteine s'effectue apres transformation dans E coli Ml 5. Le 
plasmide pQE30, 31 et 32 possedent en amont du site de polyclonage la sequence 
codante pour une suite de 6 histidines presentant une affmite pour les ions nickel. Cet 
enchainement permet la purification de la proteine chimerique exprimee. par adsorp- 
15 tion sur une resine constitute d'un ligand chelatant, l'acide nitrilotriacetique (NT A), 
charge de 4 ions nickel (resine NI-NTA, Qiagen). 

La transformation s'effectue par eiectroporation ou traitement au 
chlorure de calcium. Par exemple, une colonie d'E coli Ml 5 est incubee dans 100 ml 
de milieu LB contenant 250 fig de kanamycine, sous agitation a 37°C jusqu'a 
20 1'obtention d'une DO 600 de 0,5. Apres une centnrugation de 5 minutes a 2000g a 4°C, 
le culot bacterien est repris dans 30 ml de solution TFB1 (100 mM de chlorure de 
rubinium, 50 mM de chlorure de manganese, 30 mM d'acetate de potassium, 10 mM 
CaC12, 15% glycerol, pH 5.8), k 4°C pendant 90 minutes. Apres une centrifugation de 
5 minutes a 2000g a 4°C, le culot bacterien est repris dans 4 ml de solution TFB2 (10 
25 mM de chlorure de rubidium, 10 mM de MOPS, 75 mM CaC12. 15% de glycerol , pH 
8). Les cellules peuvent etre gardeeS a -70°C par aliquot de 500 ml. 20 jil de la ligation 
et 125 |ii de cellules competentes sont melanges et places dans la glace 20 minutes. 
Apres un choc thermique de 42°C pendant 90 secondes, les cellules sont agitees 90 
minutes a 37°C dans 500 ml de milieu Psi-broth (milieu LB complemente par 4 mM 
30 de MgS0 4 , lOmM de chlorure de potassium). Les cellules transformees sont etalees 
sur des boites LB-agar complementees par 25 |ig/ml de kanamycine, et 100^g/ml 
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d'ampicilline, et les boites sont incubees une nuit a 37°C. 

Les clones potentiellement recombinants sont repiques de maniere 
ordonnee sur un filtre de nylon depose sur une boite LB-agar complementee par 25 
u.g/ml de kanamycine et 100 ug/ml d'ampicilline. Apres une nuit a 37°C. les clones 
5 recombinants sont reperes par hybridation de 1'ADN plasmidique avec la sonde 
nucleotidique amplifiee par PCR avec le couple d"amorces selon SEQ ID NO:45 et 
SEQ ID NO:46. 

Une colonie independante, comenant l'insert, est inoculee a 20 ml de 
milieu LB complementee par 25 ug/ml de kanamycine et 100 (ig/ml d'ampicilline. 

10 Apres une nuit a 37°C sous agitation, 500 ml de meme milieu sont incubes au 1/50° 
par cette preculture jusqu'a l'obtention d'une DO 600 de 0,8, puis 1 a 2 mM final d'IPTG 
est ajoute. Apres 5 heures, les cellules sont centrifugees 20 minutes a 4000 g. 

Une partie du culot cellulaire est repris dans 5 ml de tampon de 
sonication (50 mM de phosphate de sodium pH 7,8. 300 mM NaCl) puis place dans la 

15 glace, Apres une rapide sonication, les cellules sont centrifugees 20 minutes a 
1 0000 g. Une partie du culot cellulaire est repris dans 10 ml d'une solution 30 mM 
Tris/HCl-20% sucrose pH8. Les cellules sont incubees 5 a 10 minutes sous agitation, 
apres adjonction de 1 mM EDTA. Apres une centrifugation de 10 minutes a 8000 g a 
4°C, le culot est repris dans 10 ml de 5 mM de MgS04 glace. Apres 10 minutes dans 

20 la glace sous agitation, les cellules sont centrifugees 1 0 minutes a 8000 g a 4°C. 

Le culot est repris par 5 ml/g dans du tampon A (6 M GuHCl 
(chlorhydrate de guanidine), 0.1M phosphate de sodium, 0,0 1M Tris/HCl, pH 8), 1 
heure a temperature ambiante. Le lysat est centrifuge 15 minutes a 10000 g a 4°C, et le 
surnageant est complemente par 8 ml de resine Ni-NTA, preequilibree dans du tampon 

25 A. Apres 45 minutes a temperature ambiante, la resine est coulee dans une colonne, 
lavee par 10 fois le volume de la colonne par du tampon A puis par 5 fois le volume 
da la colonne par du tampon B (8 M uree, 0,1 M phosphate de sodium, 0,01 M 
Tris/HCl, pH 8). La colonne est lave par du tampon C (8 M uree, 0,1M phosphate de 
sodium, 0,01 M Tris/HCl, pH 6,3) jusqu'a ce que TA280 soit inferieur a 0,01. La 

30 proteine recombinante est eluee par 10 a 20 ml de tampon D (8 M uree, 0.1 M 
phosphate de sodium, 0,01 M Tris/HCl. pH 5 f 9) puis par 10 a 20 ml de tampon E (8 M 
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uree, 0,1 M phosphate de sodium, 0,01 M Tris/HCl, pH 4,5), puis par 20 ml de tampon 
F (6 M HC1, 0,2 M acide acetique). Apres une analyse en SDS-PAGE. la ou les 
fractions purifiees contenant la proteine chimerique ont permis Tobtention d'anticorps 
chez le lapin. Les anticorps obtenus sont testes par Western-blot apres revelation par 
5 un anticorps secondaire couple a la phosphatase alcaline. 

Des anticorps sont obtenus de la meme maniere, a partir de peptides 
synthetises chimiquement selon la technique de Merrifield (G. Barany and B. 
Merrifield, 1980, dans The peptides, 2, 1-284, E. Gross et J. Meienhofer. Academic 
Press, New York). 

10 Les anticorps specifiques obtenus sont utilises a fin de detection de 

T expression serique ou tissulaire de tout ou partie des sequences retro virales endo- 
genes selon Tinvention, dans les cas normaux et pathologiques. 

Les proteines d'origine serique ou tissulaire, sont separees sur gel 
d'acrylamide-SDS puis transferees sur un filtre de nitrocellulose a I'aide d'un appareil 

15 Novablot 2117-2250 (LKB). Le transfert est effectue sur une feuille de Hybond C- 
extra (Amersham) en utilisant un tampon CAPS 100 mM pH 11, methanol, eau 
(V/V/V: 1/1/8) contenant 1 mM de CaCb. Apres un transfert de I heure a 0,8 

mA/cm 2 , la feuille est saturee une heure a temperature ambiante dans du PBS-0,5 % 
gelatine. La feuille est mise en presence de l'anticorps specifique a la concentration de 

20 1/1000 dans du PBS-0,25 % gelatine. Au bout de 2 heures, le filtre est lave 3 fois 15 
minutes dans du PBS-0,1 % de Tween-20, puis le filtre est incube 30 minutes en 
presence d'un anticorps secondaire couple a la phosphatase alcaline (Promega), dilue 
au 1/7500 dans du PBS-0,25% gelatine. Apres trois lavages dans du PBS-0,1 % de 
Tween-20, le filtre est equilibre dans un tampon (100 mM de Tris-HCl pH 9,5, 100 

25 mM de NaCl, 5 mM de MgCb). La revelation est effectuee en presence de 45 u=l de 
NBT a 75 mg/ml et 35 u.1 de BCIP a 50 mg/ml, pour 10 ml de tampon de phosphatase 
alcaline. 

Les proteines chimeriques obtenues par genie genetique, sont utili- 
sees aussi a fin de tests d'activite biologique, comme par exemple pour le test 
30 d'activite biologique du peptide de type CKS-17 identifie dans le domaine env de 
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HERV-7q (figure 5). 

EXEMPLE 5 : Obtention de sondes ribonucleiques codant pour les sequences env 
deHERV-7q. 

Les fragments de PCR obtenus sont sous clones dans le plasmide 
PGEM 4Z (Promega) qui possede de par et d'autre de son site de polyclonage, les 
sequences promotrices pour les ARN polymerase SP6 et T7. 

La methode de competence utilisee est l'electroporation. Le plasmide 
et le fragment de PCR sont hybrides dans un rapport de 50 ng de vecteur (coupe a Sma 
I) pour 100 ng de fragment de PCR (rendu a bout franc par traitement par le fragment 
de Klenow de l'ADN polymerase). L'incubation a lieu une nuit a 22 C C. dans le 
tampon de ligation (66 mM Tris-HCl pH 7,5, 5 mM MgCI2. 1 mM dithioerythritol, 
1 mM ATP) en presence de lu. de T4 ADN ligase puis est arretee par denaturation 10 
minutes a 65°C. Parallelement, la souche d'E. Colt JM 105 est ensemencee une nuit a 
37°C dans du milieu LB. Cette preculture est diluee au 1/500 et placee a 37°C jusqu'a 
une DO 600 egale a 1. Pour la suite du mode operatoire les cellules seront toujours 
conservees au froid. Apres une centrifiigation de 5 minutes a 3500 g a 4°C, le culot 
cellulaire est resuspendu dans 1/4 vol. d'eau glacee ultra-pure. Cette etape est repetee 5 
a 6 fois. Puis le culot est resuspendu dans 1/4000 vol. d'eau; 10 % de glycerol sterile 
sont ajout.es permettant la conservation des cellules electrocompetentes, par aiiquots 
de 10 ui a 20°C. A 50 \ii de ceiiuies electrocompetentes est ajoute 1 \xl de la ligation ; 
le tout est soumis a une decharge electrique de 12,5 kV/cm, appliquee pendant 5,8 ms. 
Les cellules sont rapidement remises en suspension dans le milieu SOC incubees 1 
heure a 37°C, puis etalees, en presence de 2% X-Gal dans du dimethylformamide, et 
10 mM d'IPTG, sur une boite de gelose LB-agar supplementee en ampicilline (100 
}ig/ml). Apres une nuit a 37°C, les clones Wanes potentiellement recombinants, sont 
repiques de maniere ordonnee sur une boite LB/ampicilline et parallelement sur un 
filtre de nylon depose sur une boite LB/ampicilline. Ces deux boites sont incubees une 
nuit a 37°C. Les clones recombinants sont alors reperes par hybridation avec une 
sonde nucleique amplifiee par PCR avec le couple d'amorces selon SEQ ID NO:45 et 
SEQ ID NO:46 et marquee a la digoxygenine. 

Les clones recombinants sont cultives dans 50 ml de milieu 
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LB/ampicilline (100 ug/ml) en agitation pendant une nuit a 37°C. Apres une centrifu- 
gation a 3500 g pendant 15 minutes a 4°C, le culot bacterien est repris dans 4ml de 
tampon PI (50 mM Tris-HCI, lOmM EDTA, 400 j.ig/ml RNase A, pH 8) et 4ml de 
tampon P2 (200 mM NaOH, 1% SDS). Le melange est incube a temperature ambiante 
5 pendant 5 minutes. Apres adjonction de 4ml de tampon P3 (2.55 M d'acetate de potas- 
sium, pH 4,8) le melange est centrifuge a 12000 g pendant 30 minutes a 4°C. Le 
surnageant est applique sur une colonne Qiagen-type 100, preequilibree avec 2 ml de 
tampon QBT (750 mM NaCl, 50 mM MOPS, 15% ethanol, pH 7). la colonne est lavee 
avec 2 fois 4ml de tampon QC (1M NaCl, 50 mM MOPS, 15 % ethanol, pH 7) et 

10 l'ADN est elue avec 2ml de tampon QF (1,2 M NaCl. 50mM MOPS, 15 % ethanol, pH 
8). L'ADN est precipite avec 0,8 vol. d'isopropanoi, et centrifuge a 12000 g a 4°C 
pendant 30 minutes. Le culot est lave avec de l'ethanol a 70 % glace, puis l'ADN 
plasmidique est repris par 2 fois 150 [il de tampon TE. 

Les sondes ribonucleiques sont utilisees comme sondes specifiques, 

15 en particulier pour la detection des transcrits exprimes par les sequences retro virales 
endogenes selon l'invention. 

EXEMPLE 6 : Construction d'une souris transgenique contenant tout ou partie 
du gene de l'enverine. 

Une souris transgenique contenant tout ou partie de la sequence 
20 HERV-7q (SEQ ID NO:3) est construite arm d'identifier les sequences responsables 
de la specificite tissulaire, et pour evaluer le role de tout ou partie des motifs retro- 
viraux endogenes de type HERV-7q, en particulier tout ou partie des motifs pepti- 
diques de l'enverine. La technique de micro-injection utilisee se refere a la technique 
classique (Hogan et coll., (1994), Manipulating the mouse embryo, Cold Spring 
25 Harbor, Cold Spring Harbor Laboratory Press) ou a ses equivalents. Des formes iden- 
tiques a la molecule humaine normale de motifs de type HERV-7q, dont l'enverine, ou 
des formes mutees, deletees, presentant des insertions ou tronquees sont testees afin de 
determiner les motifs critiques tant sur le plan normal que pathologique, et plus parti- 
culierement au cours du developpement foetal et lors des processus tumoraux. 
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Ainsi que cela ressort de ce qui precede, 1' invention ne se limite 

nullement a ceux de ses modes de mise en ceuvre, de realisation et duplication qui 

viennent d'etre decrits de facon plus explicite ; elle en embrasse au contraire toutes les 
15 variantes qui peuvent venir a l'esprit du technicien en la matiere, sans s'ecarter du 

cadre, ni de la portee, de la presente invention. 
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REVINDICATIONS 

1°) Fragment d'acide nucleique purifie. caracterise en ce qu'il 
comprend tout ou partie d'une sequence codant pour une sequence retroviral endo- 
gene humaine, qui presente au moins des motifs retroviraux de type env. repondant a 
5 la sequence SEQ ID NO: I ou a une sequence presentant un niveau d'homologie avec 
ladite sequence SEQ ID NO:l superieur ou egal a 80% sur plus de 190 nucleotides ou 
superieur ou egal a 70% sur plus de 600 nucleotides pour les domaines de type env. 

2°) Fragment d'acide nucleique selon la revendication 1. caracterise 
en ce qu'il presente a la fois de motifs retroviraux correspondant a un domaine env et 

10 repondant a la sequence SEQ ID NO:l et des motifs retroviraux correspondant a un 
domaine gag et repondant a la sequence SEQ ID NO:2 ou a une sequence presentant 
un niveau d'homologie superieur ou egal a 80% sur plus de 190 nucleotides ou supe- 
rieur ou egal a 70% sur plus de 600 nucleotides pour les domaines de type env et un 
niveau d'homologie superieur ou egal a 90% sur plus de 700 nucleotides ou superieur 

15 ou egal a 70% sur plus de 1200 nucleotides pour les domaines de type gag, lesquels 
motifs ne presentent aucune insertion ou deletion superieure a 200 nucleotides. 

3°) Fragment d'acide nucleique, caracterise en ce qu'il comprend un 
segment d'une sequence selon la revendication 1 ou la revendication 2 et notamment 
les sequence SEQ ID NO:3-22, 28 et 61, les sequences nucleiques complementaires et 

20 les sequences inverses complementaires des sequences precedentes ainsi que les 
fragments issus des regions codantes des sequences precedentes correspondant a un 
cadre glissant superieur ou egal a 14 nucleotides ou leurs sequences complementaires. 

4°) Transcrits, caracterises en ce qu'ils sont generes a partir des 
sequences selon Tune quelconque des revendications 1 a 3. 

25 5°) Reactif de diagnostic pour la detection differentielie de 

sequences nucleiques endogenes humaines completes ou partielles, presentant des 
motifs retroviraux, selectionnes parmi les sequences SEQ ID NO:l et/ou SEQ ID 
NO:2, caracterise en ce qu'il est selectionne dans le groupe constitue par les sequences 
SEQ ID NO: 1-22, 28, 37-57, 59-61 et 121-122, les sequences nucleiques comple- 

30 mentaires et les sequences inverses complementaires des sequences precedentes, par 
les fragments nucleotidiques capables de definir ou d ? identifier les sequences SEQ ID 
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N0:1 et/ou SEQ ID NO:2 et toute sequence flanquante ou les chevauchant ainsi que 
par les fragments issus des regions codantes des sequences SEQ ID NO: 1-22 et 61. 
correspondant a un cadre glissant superieur ou egal a 14 nucleotides ou leurs 
sequences complementaires, eventuellement marquees avec un marqueur approprie. 
5 6°) Reactif selon la revendication 5, caracterise en ce qu'il est choisi 

dans les regions situees entre les nucleotides 3065 et 4390, les nucleotides 6965 et 
9550 ou les nucleotides 2502-2865 de la SEQ ID NO:3. 

7°) Reactif selon la revendication 5, caracterise en ce qu'il est selec- 
tion^ parmi les sequences SEQ ID NO:37-57, 59-60 et 121-122 et en ce qu'il est apte 
1 0 a etre utilise comme amorce. 

8°) Reactif selon la revendication 5, caracterise en ce qu'il est selec- 
tionne parmi les sequences suivantes : 

- un fragment de 1505 nt arnplifie par le couple d'amorces SEQ ID 
NO:37 et SEQ ID NO:38 (amorces GIF et G1R), 

15 - un fragment de 2529 nt arnplifie par Ie couple d'amorces SEQ ID 

NO:45 et SEQ ID NO:46 (amorces E1F et E1R) 

- un fragment de 182 nucleotides repete deux fois. situe en amont du 
domaine gag aux positions 2502-261 1/2613-2865 

et en ce qu'il est apte a etre utilise comme sonde. 

20 9°) Reactif seion la revendication 5, caracterise en ce qu'il est choisi 

dans le groupe constitue par les fragments codants ou non-codants pour tout ou partie 
de Tenverine et notamment les fragments comprenant au moins 14 nucleotides et plus 
particulierement les fragments codant pour la partie C-terminale de Tenverine, soit a 
partir de l'acide amine 291, soit a partir de Pacide amine 32 L a compter du codon 

25 codant pour la premiere methionine. 

10°) Procede de detection rapide et differentiel des sequences 
nucleiques retrovirales endogenes de type env ou env et gag, de leurs variants 
normaux ou pathologiques, par hybridation et/ou amplification genique, realise a partir 
d'un echantillon biologique, lequel procede est caracterise en ce qu'il comprend : 

30 (a) une etape dans laquelle Ton met en contact un echantillon biolo- 

gique a analyser avec au moins une sonde selon la revendication 5, la revendication 6 
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ou la revendication 8 et 

(b) une etape dans laquelle on detecte par tout moyen approprie le ou 
les produits resultants de ['interaction sequence nucleotidique-sonde. 

1 1°) Procede de detection selon la revendication 10. caracterise en 
5 ce qu'il comprend : 

* prealablement a 1' etape (a) : 

. une etape de preparation du tissu ou du liquide biologique 

conceme, 

. une etape d'extraction de l'acide nucleique a detecter, et 
10 . au moins un cycle d'amplification genique mis en ceuvre a l'aide 

d'au moins un reactif selon Tune quelconque des revendications 5 a 7 et 

* posterieurement a V etape (b) : 

. une etape de comparaison des sequences nucleiques obtenues dans 
ledit echantillon biologique avec les sequences retrovirales endogenes humaines selon 
15 Tune quelconque des revendications I a 3, par tout moyen approprie et notamment par 
sequencage, Southern-blot coupure de restriction, SSCP ou toute autre methode 
permettant d' identifier une insertion ou une deletion ou encore une simple mutation 
entre les differentes sequences comparees. 

12°) Procede de detection des transcrits selon la revendication 4, 
20 caracterise en ce qu'il comprend : 

- le prelevement des ARN messagers provenant d'echantillons 
biologiques temoins et d'echantillons analogues preleves chez des patients et 

- Tanalyse qualitative et/ou quantitative desdits ARNm, par hybri- 
dation in situ, par dot-blot, Northern-blot, RNAse mapping ou RT-PCR, a l'aide d'un 

25 reactif de diagnostic selon Tune quelconque des revendications 5 a 9. 

13°) Sequences chimeres, caracterisees en ce qu'elles sont consti- 
tutes par un fragment de 17 a 40 nucleotides d'une sequence flanquante selectionnee 
dans le groupe constitue par les transcrits et ADNc des sequences genomiques, qui 
codent pour tout ou partie d'un facteur, dont la fonction, la regulation/deregulation ou 

30 l'alteration est associee a Texpression normale ou pathologique ou a la regula- 
tion/deregulation de motifs appartenant a ladite famillc HERV-7q, ces sequences 
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correspondant a des sequences nucleotidiques codant pour des genes situes dans des 
regions flanquantes situees en amont et/ou en aval d'une sequence retrovirale de ladite 
famille HERV-7q dont 1'une des extremites ne peut se trouver a une distance excedant 
120 kb, associee a un motif retroviral endogene de type HERV-7q comprenant entre 
5 17 et 40 nucleotides selon les revendications 1 a 4. 

14°) Methode de detection et/ou devaluation d'une sur-expres- 
sion/sous-expression ou d'une modification d'au moins Tune des sequences ou frag- 
ments de sequences retrovirales endogenes de type HERV-7q et/ou de leurs sequences 
flanquantes associees, selon l'une quelconque des revendications 1 a 9, caracterisee en 

10 ce qu'elle comprend : 

- le depot sur un support approprie. de l'ADNc provenant de clones, 
de produits de PCR obtenus a partir d'ADN genomique. de produits de RT-PCR 
provenant de transcrits ou encore de sequences oligonucleotidiques specifiques, 
lesdites sequences d'ADN etant des sequences ou des fragments de sequences retro- 

1 5 virales endogenes de type HERV-7q et/ou leurs sequences flanquantes, constitutes par 
les transcrits et ADNc des sequences genomiques, qui codent pour tout ou partie d'un 
facteur, dont la fonction, la regulation/deregulation ou 1'alteration est associee a 
l'expression normale ou pathologique ou a la regulation/deregulation de motifs 
appartenant a ladite famille HERV-7q, ces sequences correspondant a des sequences 

20 nucleotidiques codant pour des genes situes dans des regions flanquantes situees en 
amont et/ou en aval d'une sequence retrovirale de ladite famille HERV-7q dont l'une 
des extremites ne peut se trouver a une distance excedant 120 kb et/ou une sequence 
chimere selon la revendication 13, 

- l'hybridation dudit support avec au moins une sonde marquee de 
25 maniere adequate obtenue, par exemple, par retrotransposition d'un melange d'ARN 

provenant de cellules, de tissus ou de liquides biologiques provenant de temoins 
reputes normaux, de membres de populations ethniques differentes. de patients atteints 
de pathologies souvent associees a une expression de retrovirus, comme les processus 
tumoraux, ou comme les maladies auto-immunes, et 
3Q - la detection des hybrides formes. 

15°) Methode selon la revendication 14, caracterisee en ce que ledit 
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transcrit ou ADNc est selectionne dans le groupe constitue par les sequences SEQ ID 
NO:62-67 et 119 et leurs fragments correspondant a un cadre glissant superieur ou 
egal a 14 nucleotides ou leurs sequences complementaires. 

16°) Methode selon la revendication 14 ou la revendication 15. 
5 caracterisee en ce que ledit support comprend en outre toute sequence retroviral 

endogene ou exogene. 

17°) Kit de detection et/ou devaluation d'une maladie auto-immune 
et notamment des neuropathologies a etiologie auto-immune, caracterise en ce qu'il 
comprend outre les tampons necessaires a la mise en oeuvre d^un precede selon Tune 
10 quelconque des revendications 14 a 16 : 

- des reactifs A de diagnostic selon Tune quelconque des revendica- 
tions 5 a 9, et 

- des reactifs B consumes par les transcrits et ADNc des sequences 
genomiques, qui codent pour tout ou partie d'un facteur. dont la fonction, la regula- 

15 tion/deregulation ou l'alteration est associee a l'expression normale ou pathologique 
ou a la regulation/deregulation de motifs appartenant a ladite famille HERV-7q ? ces 
sequences correspondant a des sequences nucleotidiques codant pour des genes situes 
dans des regions flanquantes situees en amont et/ou en aval d'une sequence retroviral 
de ladite famille HERV-7q dont Tune des extremites ne peut se trouver a une distance 

20 excedant 120 kb, 

lesquels reactifs sont de preference fixes sur un support approprie. 

18°) Kit selon la revendication 17, caracterise en ce que lesdits 
reactifs B sont selectionnes dans le groupe constitue par les sequences SEQ ID 
NO:62-67 et 119 et leurs fragments correspondant a un cadre glissant superieur ou 
25 egal a 14 nucleotides ou leurs sequences complementaires. 

19°) Produits de traduction, caracterises en ce qu'ils sont codes par 
une sequence nucleotidique selon Tune quelconque des revendications 1 a 4. 

20°) Peptide, caracterise en ce qu'il est susceptible d'etre exprime a 
I'aide d'une sequence nucleotidique selectionnee dans le groupe constitue par les 
30 sequences SEQ ID NO: 1-22, 28 et 61 selon Tune quelconque des revendications 1 a 4. 

21°) Peptide selon la revendication 20. caracterise en ce qu'il 
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englobe les peptides derives comprenant entre 5 et 540 aminoacides et notamment un 
fragment de 538 aminoacides, commencant a la premiere methionine de la sequence 
SEQ ID NO:26 (enverine). 

22°) Peptide selon la revendication 20 ou la revendication 21. 
5 caracterise en ce qu'il est selectionne dans le groupe constitue par : 

. les sequences SEQ ID NO:23-36 ; 

. la sequence SEQ ID NO:58 ; 

. un fragment C-terminal de la sequence SEQ ID NO:26, soit a partir 
de I'acide amine 291, sott a partir de I'acide amine 321, a compter de la premiere 
10 methionine de la sequence SEQ ID NO:26 ; 

- un peptide de type CKS-17/CKS-25 present dans Tune des 

sequences SEQ ID NO:23-36 ou 58 ; et 

- les peptides presentant une affinite avec un des haplotypes du 
systeme HLA de classe I ou de classe II et notamment les fragments 399-471, 244-271 

15 de l'enverine, ainsi que les peptides de sequence SEQ ID NO:68-l 18, conformement 
au Tableau I. 

23°) Peptide selon Tune quelconque des revendications 20 a 22, 
caracterise en ce qu'il est obtenu a partir des sequences nucleiques selon l'une 
quelconque des revendications 1 a 4, dans lesquelles au moins un codon non-sens peut 
20 etre remplace par un codon codant pour l'un des aminoacides suivants : Phe (F), Leu 
(L), Ser (S), Tyr (Y), Cys (C), Trp (W), Gin (Q), Arg (R), Lys (K), Glu (E) ou Gly 
(G). 

24°) Compositions immunogenes ou vaccinates, pour la protection 
contre les maladies auto-immunes, notamment chez les sujets a risque, caracterisee en 
25 ce qu'elle comprend au moins un peptide comprenant au moins un motif de type CKS 
et/ou au moins un motif selectionne dans le groupe constitue par les peptides presen- 
tant une affinite avec un des haplotypes du systeme HLA de classe I ou de classe II et 
au moins un vehicule pharmaceutiquement acceptable. 

25°) Composition selon la revendication 24, caracterisee en ce que 
30 ledit peptide presentant une affinite avec un des haplotypes du systeme HLA de classe 
I ou de classe II, est selectionnee dans le groupe constitue par les peptides tels que 
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de finis dans le Tableau I. 

26°) Composition selon la revendication 24 ou la revendication 25, 
caracterisee en ce que ledit peptide presente la sequence SEQ ID NO: 120. 

27°) Anticorps, caracterise en ce qu'il est dirige contre Tun ou 
5 plusieurs des peptides selon Tune quelconque des revendications 20 a 23. 

28°) Composition pharmaceutique, caracterisee en ce qu'elle 
comprend des anticorps neutralisants produits a partir des peptides du Tableau I (SEQ 
ID NO-.68-1 18) et leurs homologues. 

29°) Procede de depistage immunologique differentiel de sequences 
10 retrovirales endogenes humaines de la famille HERV-7q normales ou pathologiques, 
caracterise en ce qu'il comprend la mise en contact d'un echantillon biologique avec 
un anticorps selon la revendication 27, la lecture du resultat etant revelee par un 
moyen approprie, notamment EIA, ELISA, RIA, fluorescence. 

30°) Procede <f identification et de detection de motifs retro viraux 
15 endogenes, anormalement exprimes dans le cadre de pathologies associees au cancer, 
ou de neuropathologies en particulier autoimmunes, au premier rang desquelles la 
sclerose en plaques, caracterise en ce qu'il comprend I'analyse comparee des sequences 
extraites d'un echantillon biologique avec les sequences selon l'une quelconque des 

revendications 19 a 23. 

20 31°) Application des sequences selon Tune quelconque des revendi- 

cations 1 a 9, 13, 14 ou 19 a 23 au diagnostic, au pronostic, a revaluation de la 
susceptibtlite genetique, a toutes maladies humaines induites, innees ou acquises en 
particulier celies a composantes cancereuses, autoimmunes et/ou a incidence neuro- 
logique, comme la sclerose en plaques, les syndromes associes et les maladies neuro- 

25 degeneratives ou intervient tout ou partie des sequences selon Tune quelconque des 
revendications 1 k 5 et des formes endogenes ou exogenes apparentees. 

32°) Sequences nucleiques hybrides, caracterisees en ce qu'elles 
comprennent des sequences ou motifs selon l'une quelconque des revendications 1 a 
9, combines avec des sequences ou motifs d'origine endogene ou d'origine ou induits 

30 de maniere exogene. 

33°) Vecteur recombinant de clonage ou d'expression, caracterise en 
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ce qu'il comprend une sequence nucleique selon Tune quelconque des revendications 
I a 4. 

34°) Composition immunogene ou vaccinale, caracterisee en ce 
quelle comprend un vecteur incluant au moins une sequence nucleique codant un 
5 peptide tel que defmi dans le Tableau I, eventuellement associee a une sequence 
codant un motif de type CKS-17. 

35°) Vecteur de therapie genique, caracterise en ce qu'il comprend 
tout ou partie des sequences nucleiques retrovirales endogenes de type HERV-7q 
selon Tune quelconque des revendications 1 a 4. 
10 36°) Vecteur selon la revendication 35, caracterise en ce que lesdites 

sequences sont selectionnees dans le groupe constitue par les sequences SEQ ID 
NO:2, 20et2L 

37°) Animaux transgeniques, caracterises en ce qu'ils comprennent 
tout ou partie d'une sequence de type HERV-7q (SEQ ID NO: 1-22 , 28 et 61). 

15 
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CCCTGGGGCGGGCTTCCTTTCTGGGATGAGGGCAAAACGCCTGGAGATACAGCAATTATCTT3CAACTGAG 

ftnACABGAC TAGCTGGATTTCCTAGGCCGACTAAGAATCCCTAA GCCTAGCTGGGAAGGTGACCACGTCCAC 

rTTTAAACA CGGGGCTTGCAACTTAGCTCACACCTGACC.AAT CAGAGAGCTCACTAAAATGCTAATTAGGCA 

aar,arAr,GAG GTAA AGAAATAGCCAATCATCTATTGCCTGAGAGCACAGCAG GAGGGACAACAATCGGGATA 

TAAArrr.AGGC ATTCGAGCTGGCAA CAGCAGCCCCCCTTTGGGTCCCTTCC CTTTGTATGGGAGCTGTTTTC 

ATnrTATTTCACT CTATTAAATCTTGCAACTGCACTCTTCTGGTCC ATGTTTCTTACGGCTCGAGCTGAGCT 

TTTnrTC!ACCGTC CACCACTGC TGTT?GCCACCACCGCAGACCTG C CGCTGACTCCCATCCCTCTGGATCCT 

r.r AflRnTfiTCCG CTGTGCTCCTG ATCCAGCGAGGCGCCCATTGCCGC T CCCAATTGGGCTAAAGGCTTGCCA 

TTr,TTrrTGCA CGGCTAAGTGCC TGGGTTTGTTCTAATTGAGCTGAACACTAGTC ACTGGGT TCCATGGTT C 

TrTTrTCTnarrrAC GGCTTCTA ATAGAACTAT^CACTTACCACAT GGCCCAAGATTCCATTCCTTGGAAT 

rrCTfiAfifiCC AAGAACTCCAGGTC AGAGAATACGAG G rTTGCCACCATCTTGGAAGC GGCCTGCTACCATCT 

TGGAAGTGGTTCACCACCATCTTGGGAGCTCTGTGAGCAAGGAC^^ 

ckacatccaaj^^^ 

GAGGAAAATACCGGGCACTTGTCGGCCAGTTAAAAACGATTAGTGTGGCCACCGGACT.nAGACTCAGuTG, 

gagSctggggaaggg^^ 

GGCAGTAGCCGGTTGAGATCATGGTGTAGCCAGAAGTCTCAACAGTCGCCCATGCATGCACCCC.A.CTT.C 
C^C?GACCCATACCTCCTGGGTCCCAACCAC^ 

SaScctctgatccctgc 

ATCTCCAMGGGATCTAAGGAAGCTCTGCGCTGCGTCCTTAGGCACCTA 

CCCTGG^CCCTCCCAATTTAGGCATACAGCTCTTGACATGGGCAGTTATGTAGGACCCACTCCCC^ 

CCTTGCCAGGGCCCCAAGTTTGTAAATGGCTGAGGGAAAAGAGAGACAGAGGAGAGA^ 

GAAAGAGAGAGAGACAGAGAGGAGAGAGAGACAGTGAGAGAGACAGAAGAGAGAoAGAGACAAAG^ 

AGAGAGAGTCAAAGAGAGAAAGAAAGAGAAAGAAATAGTAAAAJUVCAGTGTGCCCTATTCCTTTAAAAGCCA 

GGGTA^TTTA^CCTGTACTTGATAATTGAAGGTCTTCTCTGTGACCCTATAGCACTCC 

TGGTCAGTGTAAATAAGAGCATAGGCCGAAAGCACTGAGGCC^ 

TCCTTAACCCAGTAACCCGCAGATGGACCAAATGCATTCAGTCGGTAGCGCAACTGCTTTGCTAAAAGTAGA 
AAAGTAACTTTTAGAGGAAACCTCATTGTGAGCACACCTCACCTGTTCAGAATTATTCTAATAAAAAAAG>-A 
A^AAGCTAGCTTACTAACTCAAAAATCTTAAAGTATGGGGCTATTCTGTTAGAA^ 
A^^CTGATAATTCCCTTAACCCAGCAGATTTCCT 

ACCAGACCTAGGCGGAACTCCCTTCAGGACAGGACGATAGATGGTTCCTCCCAGGTGATTGAGGAAAAAAAC 

tct™tcawkgtgtc^^ 

cttgatggggcagctgggttgttataaaataggaacccagcccagctctaggactc 

GC^TGTTGGGCATGCTGGTAAAGGACCAC TAGAATCCAGCAGCCCAGACr.CCTTTCTTTGTGGTCAAGAAA 
^.r.AAAA^GTGCAGGACTGCTA^ ^^ 

b^M^iuwi _ _ _ , ^^^^^^^^^^ n^r.TTnnnrArriCTGGTAAAGGACCACTAG 




™£IgI*^ 

AGATGGGAAACGTTCCCCOrAAGACAAAAACG^ 

T^r^zr^f^ATCT TACAGCTAGACCTCTTTTG'TAGAAAAGGCAAATGGAGTGAAGTGCCATAAGTACAAAC T 
TTCTTTTCAT TAAGAGACAACTCACAATTATGTAAAAAGTGTGATTTA TGCCCTACAGGAAGCCTTCAGAGi 

ii^^^ ^^ACAAAAGGGTAAACAGTGAACCAAAGAGTGCCAA T ^ T ^^AATrATGACCCC7CCAACX 
^^G^^i^GAJ^AGAATTCGGCCCAGCCAGAGTGCATGTGCCTTTTTCTCT CCC AGACTT AAAGC^ ^ATAAA 

aTcagTcTtaggtj^ttctcagataaccc^ 

TY^rr^ njkrATGGAGAGATATAATGTCACTGCTAAATCAGACAC TAACCCCAAATGAGAGAAGTGCCACCAT 
" J ^ i ~~~~.„r-«T-^Tri r*?rriiTr:iT&rj:ATGACAACAGAGGAAAG 




AGAArGArrCCCCACAGGCCAG C AGGCAGrrill*o^«^^^ 

^aA TTGGTGCTGC AGACATTTGCTAACTTGTGTGCTAGA A GGACTAAGGAAAACTAGGAAGAAGTC'^ ^2^^ 
TTACTCAATGATGTCCACCATAACACAG GGAAGGGAAGAAAA T CCTACTGCCTTTttGGAGAGACTAAGGG^ 

rACrCAGrCArcrCCAGACArTAGAAA^C rrCAA^^ 

rrTirrr.lirrrttriAC CTCGG TTTTTTATAATAGAGATCACXA G GAGCAGGCGGAACAGGACAAACCXXA 
TTAAAAAAAAG^CCACCGCrTTAGTCArGACCCT ^AfTGCAAGrGGACrTrGGAGGCTCTGGAAAAGCG^^ ^ 
r:rTf?f? GCAAATTGAArGCCrAArAGG GCrTGCTTCCAGr G CGGrCTACAAGGACACTTrAAA^AGA^ ^G^g 
CAJ^TA^^^^TAAGCCGCCCCCTCGTCCATGC ^^^ATTTCAAGGGAATCACTGGAAGGCCCACTGCCCCA 
nnnr^AC AAAGGTCCTCTGAGTCAGAAGCCACTAACCAG ATGATCCAGCAGCAGGACTGAGGGTG^£^^f^ 

fl'a f^f^rATCCCATGCCATCACCCTCACAGAGCCCTGGGT ATGCTTGACCATTGAGGGCCAGGAGGXJGJI^ 
^.GACACTGGT^GGTCTTCTTAGTCTTACTrTTCT GT CCCGGACAAC TGTCCTCCAGATCTGTCA^ Il 
C TGAGG(^TCCTAAGACGGGCAGTCA rTAGATACrrCTCCrAGCCACTAAGTTATGACTGGGGAGCTTl ^ 
Tr.TTTTCACATGCTTTTCTAATTATGCTTG AAAGCCCCACTACCTTGTTAGGGAGAGACATTCTAGCAAAAG 

CALGGCCATTATACACrTGAACATA.KAGAA^ 

B*r rrTf:AAnTCTGGGCAACAGAAGGACA ATATGGACGAGCAAAGAATGCC CGTCCT GTTCAAGTTAAACTA ^ 
. ^■.TTrrtrrTCtCTTTCCCTACCAAAG nCAGTACCCCCTC A r.ArCCAAGGCCCAACAAGGACTCCA^Gj, 
T ^TTAAGGACCTAAAAGCCCAAGGCCTAG TAAAACCATGCAGTA ArCCCTGCAGTACTCCAATTTTAG GAG 
^"r^rr^rAr.A rAr,TGGAGG TTAGTGCAAGATCTCAGGATTATCAA T GAGGCTG7TGTTCCT5TA- 
anrr AnCT GTACCTAGCCCTTATA CTCTGCTTTCCC AAATACCAGAGGAAGCAGAGTGGTTTACAGTCCTG^ 
ACCTTCAGGATGCCTTCTTCTGCATCCCTGTACATCCTGACTCTC AATTCTTGTTTGCCTTTGAAGATACTT 

FIGURE 1.1 
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CAAACCCAACATCTCAACTCACCTGGACTATTTTACCCCAAGGGTTCAGGGATAGTCCCCATCTATTTGGCC 
AGGCATTAGCCCAAGACTTGAGCCAATCCTCATACCTGGACACTTGTCCTTCGGTAGGTGGA7GATTTACTT 
TTGGCCGCCCATTCAGAAACCTTGTGCCATCAAGCCACCCAAGCGCTCTTCAATTTCCTCGCTACCTGTGGC 
TACATGGTTTCCAAACCAAAGGCTCAACTCTGCTCACAGCAGGTTACTTAGGGCTAAAA7TATCCAAAGGCA 
CCAGGGCCCTCAGTGAGGAACACATCCAGCCTATACTGGCTTATCCTCATCCCAAAACCCTAAAGCAACTAA 
GGGGATTCCTTGGCGTAATAGGTTTCTGCCGAAAATGGATTCCCAGGTATGGCGAAATAGCCAGGTCATTAA 
ATACACTAATTAAGGAAACTCAGAAAGCCAATACCCATTTAGTAAGATGGACAACTGAAGTAGAAGTGGCTT 
TCCAGGCCCTAACCCAAGCCCCAGTGTTAAGTTTGCCAACAGGGCAAGACTTTTCTTCATATGTCACAGAAA 
AAACAGGAATAGCTCTAGGAGTCCTTACACAGATCCGAGGGATGAGCTTGCAACCTGTGGCATACCTGACTA 
AGGAAATTGATGTAGTGGCAAAGGGTTGACCTCATTGTTTACGGGTAGTGGTGGCAGTAGCAGT CTTAGTAT 
CTGAAGCAGTTAAAATAATACAGGGAAGAGATCTTACTGTGTGGACATCTCATGATGTGAATGGCATACTCA 

ctgctaaaggagacttgtggctgtcagacaactgtttacttaaatgtcaggctctattacttgaagggccag 

TGCTGCGACTGTGCACTTGTGCAACTCTTAACCCAGCCACATTTCTTCCAGACAATGA AGAAAAGATAAAAC 

ataactgtcaacaagtaatttctcaaacctatgccactcgaggggaccttttagaggt tcctttgactgatc 
ccgacctcaacttgtatactgatggaagttcctttgtagaaaaaggacttcgaaaagtggggta tgcagtgg 
tcagtgataatggaatacttgaaagtaatcccctcactccaggaactagtgctcagct agcagaactaatag 

CCCTCACTTGGGCACTAGAATTAGGAGAAGAAAAAAGGGCAAATATATATACAGACTC TAAATATGCTTACC 

tagtcctccatgcccatgcagcaatatggaaagaaagggaattcctaacttctga gagaacacctatcaaac 

ATCAGGAAGCCATTAGGAAATTATTATTGGCTGTACAGAAACCTAAAGAGGTGGCAGT CTTACACTGCCGGG 

gtcatcagaaaggaaaggaaagggaaatagaagagaactgccaagcagatattgaagccaaaagagctgcaa 

GGCAGGACCCTCCATTAGAAATGCTTATAAAACAACCCCTAGTATAGGGTAATCCCCT CCGGGAAACCAAGC 

cccagtactcagcaggagaaacagaatggggaacctcacgaggacagtttt ctcccctcgggacggctagcc 

ACTGAAGAAGGGAAAATACTTTTGCCTGCAACTATCCAATGGAAATTACTTAAAACCCTTCATCAAACCTTT 
CACTTAGGCATCGATAGCACCCATCAGATGGCCAAATCATTATTTACTGGACCAGGCCTTT TCAAAACTATC 
AAGCAGATAGTCAGGGCCTGTGAAGTGTGCCAGAGAAATAATCCCCTGCC TTATCGCCAAGCTCCTTCAGGA 
GAACAAAGAA CAGGCCA TTACCC TGGAGAAGACTGGCAACTGATTT TACCCACAAGCC CAAA CC TCAGGGA T 
TTCAGTATCTACTAGTCTGGGTAGATACTTTCACGGGTTGGGCAGAGGCCTTCCCCTGTAGGACAGAAAAGG 
CCCAAGAGGTAATAAAGGCACTAGTTCATGAAATAATTCCCAGATTCGGACTTCCCCGAGG CTTACAGAGTG 
ACAATAGCCCTGCTTTCCAGGCCACAGTAACCCAGGGAGTATCCCAGGCGTTAGGTATACGATATCACTTAC 
ACTGCGCCTGAAGGCCACAGTCCTCAGGGAAGGTCGAGAAAATGAA TGAAACACTCAAAGG ACA TCTAAAAA 
AGCAAACCCAGGAAACCCACCTCACATGGCCTGCTCTGTTGCCTATAGCCTTAAAAAGAAT CTGCAACTTTC 
CCCAAAAAGCAGGACTTAGCCCA TACGAAA TGCTGTA TGGAAGGCCCTTCA TAACCAATGA CCTTGTGCTTG 
ACCCAAGACAGCCAACTTAGTTGCAGACATCACCTCCTTAGCCAAATATCAACAAGTTCTT AAAACATTACA 
AGGAACCTA TCCCTGAGAAGAGGGAAAAGAACTA TTCCACCCTTGTGACA TGGTATTAGTCAAG TCCCTTCC 
CTCTAA TTCCCCA TCCCTAGA TACATCCTGGGAAGGACCCTACCCAGTCA TTTTA TCTACCCCAACTGCGGT 
TAAAGTGGCTGGAGTGGAGTCTTGGA TACA TCACACTTGAGTCAAA TCC TGGA TACTG CCAAAGGAACCTGA 
AAA TCCAGGAGACAACGCTAGCTA TTCCTGTGAACCTCTAGAGGA TTTGCGCCTGCTCTTCAAA CAA CAA CC 
AGGAGGAAAGTAACTAAAATCA TAAA TCCCCA TGGCCCTCCCTTA TCA TATTTTT CTCTTTACTGTTCTTTT 
ACCCTCTTTCACTCTCACTGCACCCCCTCCATGCCGCTGTATGACCAGTAGCTCCCCTTACCAA GAGTTTCT 
A TGGAG AA TGCAGCGTCCCGGAAA TA T TGA TGCCCCA TCGTA TAGGAGTCTTTCTAAGGGAACCCCCACCTT 
CACTGCCCACACCCA TA TGCCCCGCAACTGCTA TCACTCTGCCACTCTTTGCA TGCA TGCAAA TACTCA T TA 
TTGGACAGGAAAAATGATTAATCCTAGTTGTCCTGGAGGACTTGGAGTCACTGTCTGTTGGACTTACTTCAC 
CCAAACTGGTA TGTCTGA TGGGGG TGGAGTTCAAGA TCAGGCAAGAGAAAAACA TGTAAAAGAAGTAA TCTC 
CCAACTCACCCGGGTACATGGCACCTCTAGCCCCTACAAAGGACTAGATCTCTCAAAACTACATGAAACCCT 
CCGTACCCA TA CTCGCC TGGTAAGCC TA TT TAA TA CCACCCTCACTGGGC TCC A TGAGGTCTCGGCCCAAAA 
CCCTACTAACTGTTGGA TA TGCCTCCCCC TGAA CTTCAGGCCA TA TGTTTCAATCCCTGTACCTGAACAA TG 
GAACAACTTCAGCACAGAAATAAACACCACTTCCGTTTTAGTAGGACCTCTTGTTTCCAAT CTGGAAATAAC 
CCA TACCTCAAACCTCACCTGTGTAAAA TTTAGCAATACTACA TACACAACCAACTCCCAA TGCATCAGGTG 
GGTAACTCCTCCCACACAAATAGTCTGCCTACCCTCAGGAATATTTTTTGTCTGTGGTACCTCAGCCTATCG 
TTGTTTGAA TGG CTCTTCAGAA TCTA TGTGCTTCCTC TCA TTCTfTAGTGCCCCCTA TGA CCA TCTACACTGA 
ACAAGATTTATACAGTTATGTCATA T^TAAGCCCCGCAACAAAAGAGTACCCATTCTTCCTTTTGTTATAGG 
WCACWGTGCTAGGTCf.AW^^ 

ATCTCAAGAArTAAATttttACATGGAJiCGGGTCGCCGAC^ 

CC XAGCAGCAGTAGTCCTTCAAAATCGAAGAGC TTTAGACTTGCTAACCGCTGAAAGAGGGGGAACCTGTTT 

A TfTTTAGGGGAAGAA TGCTG TTA TTA TGTTAA TCAA TCCGGAA ^^^^^^^^^^JJ^^^^^ 
A GA TCGAA TACAACGTAGAGCAGAGGAGCTTCGAAACA C TGGACCCTGGGGCCTCCTCAGCCAAJXGGA 
CTGGA TTCTCCCCTTCTTAGGA C < p^CTAGCA GCTA TAATA TTGCTACTCCTCTTTGGACCC TGTA TCJTTAA 
C CT CCT TGTTAACTTTGTCTC JTCCAGAA TCGAAGCTGTAAAft C T AC AAA TGGAGCCCAAGA TGCAGTCCAA 

CCCTCCTGAGGAAA TCTCAGCTGCACAACCTCTACTACGCCCCAA T TCAGCAGGAAGCAGTThGAGC GGT C 

Tmnm&rrrrrm*. r anr &r TT AGGTTTTCCTGTTGAGATGGGGG ACTG AGAG ACAGGACTAGCTGGAT 

TTCCTAGGCTGACTAAGAATCCCTAAGCCTAGCTGGGAAGGTGACCACATCCACCTTTAAACACGGGGCTTG 

CAACTTAGCTCACACCTGACCAATCAGAGAGCTCACTAAAATGCTAATTAGGCAAAGACA GGAGGTAAAGAA 

ATAGCCAATCATCTATTGCCTGAGAGCACAGCAGGAGGGACAATGATCGGGATATAAACC CAAGTCTTCGAG 

CCGGCAACGGCAACCCCCTTTGGGTCCCCTCCCTTTGTATGGGAGCTCTGTTTTCATGCTATTTCACTCTAT 

TAAATCTTGCAACTGCACTCTTCTGGTCCATGTTTCTTACGGCTTGAGCTGAG CTTTCGCTCGCCATCCACC 

ACTGCTGTTTGCCGCCACCGCAGACCCGCCGCTGACTCCCATCCCTCTGGATCATGCAGGGTG TCCGCTGTG 

CTCCTGATCCAGCGAGGCACCCATTGCCGCTCCCAATCGGGCTAAAGGCTTGCCATTGTTCCT GCATGGCTA 

AGTGCCTGGGTTCATCCTAATTGAGCTGAACACTAGTCACTGGGTTCCATGGTTCTCTTCTGTGACCCACAG 

CTTCTAATAGAGCTATAACACTCACCGCATGGCCCAAGGTTCCATTCCTTGAA TCCATAAGGCCAAGAACCC 

CAGGTCAGAGAACACGAGGCTTGCCACCATCTTCGGAGC TCTGTGAGCAAGGACCCCCAAGTAACACAACCA 

TG AGGGTGCAAATGC ATGGGCC ACT AATGGT AGAGC AAGAAAAC AGAAGGGC CCTGGT TCC TCG AAGGC AT C 

AGTGAGCTGAAATGCCTGCCCTGGATGTCCTATTCCTAGGTGTTTTTCTGCCTGAAGCAGATTAAACCCTTT 

GTT C ACTT CTC C AAGTAGGGCTTC T ATT AC AGC C C AAATC AATCCCC ACC CC AGATGACAT 
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ACTGAGAGACAGGACTAGCTGGATTTCCTAGGCCGACTAAGAATCCCTAAGCCTAGCTGGGAAGGTGACC 



ACTGAGAGACAGGACTAGCTGGATTTCCTAGGCTGACTAAGAATCCCTAAGCCTAGCTGGGAAGGTGACC 
ACGTCCACCTTTAAACACGGGGCTTGCAACTTAGCTCACACCTGACCAATCAGAGAGCTCACTAAAATGC 



ACATCCACCTTTAAACACGGGGCTTGCAACTTAGCTCACACCTGACCAATCAGAGAGCTCACTAAAATGC 
TAATTAGGCAAAGACAGGAGG7AAAGAAATAGCCAATCATCTATTGCCTGAGAGCACAGCAGGAGGGACA 



TAATTAGGCAAAGACAGGAGGTAAAGAAATAGCCAATCATCTATTGCCTGAGAGCACAGCAGGAGGGACA 
ACAATCGGGATATAAACCCAGGCATTCGAGCTGGCAACAGCAGCCCCCCTTTGGGTCCCTTCCCTTTGTA 

ATGATCGGGATATAAACCCAAGTCTTCGAGCCGGCAACGGCAACCCCC-TTTGGGTCCCCTCCCTTTGTA 
TGGGAGCT — GTTTTCATGCTATTTCACTCTATTAAATCTTGCAACTGCACTCTTCTGGTCCATGTTTCT 

TGGGAGCTCTGTTTTCATGCTATTTCACTCTATTAAATCTTGCAACTGCACTCTTCTGGTCCATGTTTCT 
TACGGCTCGAGCTGAGCTTTTGCTCACCGTCCACCACTGCTGTTTGCCACCACCGCAGACCTGCCGCTGA 

TACGGCTTGAGCTGAGCTTTCGCTCGCCATCCACCACTGCTGTTTGCCGCCACCGCAGACCCGCCGCTGA 
CTCCCATCCCTCTGGATCCTGCAGGGTGTCCGCTGTGCTCCTGATCCAGCGAGGCGCCCATTGCCGCTCC 



CTCCCATCCCTCTGGATCATGCAGGGTGTCCGCTGTGCTCCTGATCCAGCGAGGCACCCATTGCCGCTCC 
CAATTGGGCTAAAGGCTTGCCArTGTTCCTGCACGGCTAAGTGCCTGGGTTTGTTCTAATTGAGCTGAAC 



CAATCGGGCTAAAGGCTTGCCATTGTTCCTGCATGGCTAAGTGCCTGGGTTCATCCTAATTGAGCTGAAC 
ACTAGTCACTGGGTTCCATGGTTCTCTTCTGTGACCCACGGCTTCTAATAGAACTATAACACTTACCACA 



ACTAGTCACTGGGTTCCATGGTTCTCTTCTGTGACCCACAGCTTCTAATAGAGCTATAACACTCACCGCA 
TGGCCCAAGATTCCATTCCTTGGAATCCGTGAGGCCAAGAACTCCAGGTCAGAGAATACGAGGCTTGCCA 



TGGCCCAAGGTTCCATTCCTTG-AATCCATAAGGCCAAGAACCCCAGGTCAGAGAACACGAGGCTTGCCA 
CCATCTTGGAAGC 



CCATCTTGGGAGC 
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IPMALPYHIFLFTVLLPSFTLTAPPPCRCMTSSSPYQEFLWRMQRPGNIDAPSYRSLSKG 
TPTFTAHTHMPRNCYHSATLCMHANTHYWTGKMINPSCPGGLGVTVCWTYFTQTGMSDGG 
GVQDQAREKHVKEVISQLTRVHGTSSPYKGLDLSKLHETLRTHTRLVSLFNTTLTGLHEV 
SAQNPTNCWICLPLNFRPYVSIPVPEQWNNFSTEINTTSVLVGPLVSNLEITHTSNLTCV 
KFSNTTYTTNSQCIRWVTPPTQIVCLPSGIFFVCGTSAYRCLNGSSESMCFLS FLVPPMT 
I YTEQDLYSYVISKPRNKRVPILPFVIGAGVLGALGTGIGGITTSTQFYYKLSQELMGDM 
ERVADSLVTLQDQLNSLAA^ 

RSDVNDIKGTPPEEISAAQPLLRPNSAGSS 



FIGURE 4 



1 ) NSLAAVVLQNRRALDLLTAESGGTFLFLEEKC 

2 ) NSLAAWLQNRRALDLLTAERGGTCLFLGEEC 

3 ) DSLAAVTLQNHQGLDLLTAEKGGLCYFLGEDC 

4 ) DSLAAVTLQNHQGLDLLIAEKGGLCTFLGEEC 
5 } DSLAAVTLQNCRGLDLLTAEKGGHYTFLGEEC 

6) LQNRRGLDLLFLKEGGLC 

7 ) DSLAKVVLQNRRGLDLLTAEQGGICLALQEKC 



FIGURES 



TSFVEKANGVKCHKYKLSFHXETTHNYVKSVIYALQEAFRVYLPILPASPTPSPTNKDPPSTQMVQKEI 

ANIPQLXPLQAVGGREFGPARVHVPFSLPDLKQIKTDLGKFSDNPDGYIDVLQGLGQFFDLTWRDIMSLLNQTLTPNER 

SATITAAXEFGDLWYXSQVNDRMTTEEREXFPTGQQAVPSLDPHWDTE^^ 

MSTITQGREENPTAPLERLREALRKRASLSPDSSEGQLILKRKFITQSAADIRKKLQKSAVGPEQNLETLLNIA 

NRDQEEQAEQDKRDXKKGHRFSHDPQASGLWRLWKREKLGK^^ 

LEGPLPQGTKVLXVRS HXPD/ SS5RT 
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CCTGGCACTCCTGAGGGAAGTATAAATTATAACACCATCTTACAGCTAGACCTCTTTTGTAGAAAAGGCA 



CCTGGC-CTCCTGAGGGAAGTATAAATTATAACACCATCTTACAGCTAGACCTCTTTTGTAGAAAAGAAG 
-CAAATGGAGTGAAGTGCCATAAGTACAAACTTTCTTTTCATTAAGAGACAACTCACAATTATGTAAAAA 



GCAAATGGAGTGAAGTGCCATATGTACAAACTTTCTTTTCATTAAGAGATAACTCCCAATTATGTAAAAA 
GTGTGATTTATGCCCTACAGGAAGCCTTCAGAGTCTACCTCCCTATCCCAGCAT--CCCCGACTCCTTCC 



GTGTGATTTATGCCCTACAGGAAGCCCTCAGAGTCTACCTCCCGACCCCAGCAAGACCCCAACTCCTTCT 
CCAACTAATAAGGACCCCCCTTCAACCCAAATGGTCCAAAAGGAGATAGACAAAAGGGTAAACAGTGAAC 



CCAACTAATAAGGACCCCCCTTCAACCCAAATGGTCCAAAAGGAGATAGACAAAGGGGTAAACAATGAAC 
CAAAGAGTGCCAATATTCCCCAATTATGACCC-CTCCAAGCAGTGGGAGGAAGAGAATTCGGCCCAGCCA 



CAAAGAGTGCCAATATTACACGATTAT-ACTCGCTCCAAGCAGTGGGAGGA-GA-ATTT-GGCCCAGCCA 
GAGTGCATGTGCCTTTTTCTCTCCCAGACTTAAAGCAAATAAAAACAGACTTAGGTAAATTCTCAGATAA 



GCGTGCATG7ACCTTTTTCTCTCTCAGATTTAAAGCAAATTAAAATAGACCTAGGTAAATTCTCAGATAA 
CCCTGATGGCTATATTGATGTTTTACAAGGGTTAGGACAATTCTTTGATCTGACATGGAGAGATATAATG 



CCCTGATGGCTATATTGATGTTTTACAAGGGTTAGGACAATCCTTTGATCTGACATGGAGAGATATAATG 
TCACTGCTAAATCAGACACTAACCCCAAATGAGAGAAGTGCCACCATAACTGCAGCCTGAGAGTTTGGCG 

TTACTGCTAAATCAGACACTAACCCCAAATGAAAAAAGTGCTGCCATAACAGCAGCCTGAGAGTTTGGCG 
ATCTCTGGTATCTCAGTCAGGTCAATGATAGGATGACAACAGAGGAAAGAGAATGATTCCCCACAGGCCA 

AACTCTGGTATCTCAGTCAGGTCAATGATAGGATGACAACAGATGAAAGAGAATGATTCCCCACAGGCCA 
GCAGGCAGTTCCCAGTCTAGACCCTCATTGGGACACAGAATCAGAACATGGAGATTGGTGCTGCAGACAT 



GCAGGCAGTTCCCAGTGTAGACCCTCATTAGGACACAGAATCAGAACTTGGAGATTGGTGCCACAGACAT 
TTGCTAACTTGTGTGCTAGAAGGACTAAGGAAAACTAGGAAGAAGTCTATGAATTACTCAATGATGTCCA 



TTGCTAACTTGCGTGCTAGAAGGACTAAGGAAAACTAGGAAGAAGCCCATGAATTATTCAATGATGTCCC 
CCATAACACAGGGAAGGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAGGCATTGAGGAAGCG 



CTATAACACAGGGAAAGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAAGGATTGAGGAAGCA 
TGCCTCTCTGTCACCTGACTCTTCTGAAGGCCAACTAATCTTAAAGCGTAAGTTTATCACTCAGTCAGCT 



TACCTCCCTGTCACCTGACTCTATTAAAGGCCAACTAATCTTAAAGGATAAGTTTATCACTCAGTCAGCT 
GCAGACATTAGAAAAAAACTTCAAAAGTCTGCCGTAGGCCCGGAGCAAAACTTAGAAACCCTATTGAACT 



GC AG AGATTAAGAAAAAACTTCAAAAGTATGCCTTAGGCCC AG AGCAAAACTTAGAAACCCTACTGAACT 
TGGCAACCTCGGTTTTTTATAATAGAGATCAGGAGGAGCAGGCGGAACAGGACAAACGGGATTAAAAAAA 



TGGCAACCTCAGTTTTTTATAATAGAGATCAGGAAGAGCAGG-GGAATGGGACAAATGGGATAAAAAAAA 
A GGCCAC C GCTTT AGTCATGACC C T CAGGC AAGTGGACTTTGGAGGC TCTGGAAAAGGGAAAA 

AAAAAAAAGGTGACTGCTTTAGTCGTGGCCCTCAGGCAAATGGACTTTGGAGGCTCCAGAAAAGGGAAAA 
GCTGGGCAAATTGAATGCCTAATAGGGCTTGCTTCCAGTGCGGTCTACAAGGACACTTTAAAAAAGATTG 



GCTGAGCAAATTGAATGCCTAACAGGGCTTGCTTCTAGTGTGGTCTACAAGGACACTTTAAAAAAGATTG 
TC C AAGTAGAAGT AAGCC G CCCCCTC GTC C ATGCCCC TTATTTC AAG GGAATC AC TGGAAGGCCC ACT GC 



TCCAAGTAGAAACAAGCTGCCCCCTTGTCCATGCCCCTTATGTCAAGGGAATCACTGGAAGGCCCACTGC 
CCCAGGGGACAAAGGTCCTCTGAGTCAGAAGCCACTAACCAGATGATCCAGCAGCAGGACTGAGGGTGCC 

CCCAGGAGATGAAGGTCCTCTGAGTCAGAAGCCACTAACCAGATAATCCAGCAGCAGGACTGAGGATGCC 
TGGGGCAAGCGCCATCCCATGCCATCACCCTCACAGAGCCCTGGGTATGCTTGACCATTGAGGGCCAGGA 



CAGGGCAAGCGCCAGCCCATGCCATCACCCTCACAGAGCCTTGGGTATGCTTGACCATTGAGGGCCAGGA 
GGTT GTCTCCTGGACACTGGTGCGGTCTTCTTAGTCTTACTCTTCTGTCCCGGACAACTGTCCTCC 



GGTTCACTGTCTCTTGGACACTGGTATGGCCTTCTCAGTCTTACTCTCCTGTCCTGGACAACTGTCCTTC 
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01/ TAAATCCGCATGGCCCTCCCTTATCATATTTTTCT 

02/ TAAATCCCC-TGGCCCTCCCTTATCATATTTTTCT 

03/ TAAATCCCCATGGCCCTCCCTTATCATATTTTTCT 

04 / TAGATCCTCATGGCCCTCC-TTGTCATATTTTTTT 



01/CTTTACTGTTCTTTTA-CCCTCTTTCACTCTCACTGCACCCCCTCCATGCCGCTGTATGACC 
02/CTTTACTGTTCTCTTACCCCCCTTTCACTCTCACTGCACCCCGTCCATGCCACTGCACCCCC 
03/CTTTACTGTTCTCTTA-CCCCCTTTCTCTCTCACTGCACCCCCTCCATGCTGCTGTACAACC 
04/CTTTACTGTTCTCTTA-CCCCCTTTCACTCTCACTGAACCCCCTCCATGCCACTGTACTACC 

01/AGT AGCTCCCCTTACCAAGAGTTTCTATGGAGAATGCAGCGT 

02/GTCCATGCCCGTCTCATGCCAGTAGCTCCCCTTAGCAAGAGTTTCTATGGAGAATGCAGCGT 

03/AGC AGCTCCCCTTACCAAGAGTTTCTATGAAGAATGCGGCTT 

04/AGT AGCTCCCATTACCAAGAGCTTCTATGGACAATGCGGCTT 

01/CCCGGAAATATTGATGCCCCATCGTATAGGAGTCTTTCTAAGGGAACCCCCACCTTCACTGC 
02/CCCGGAAATATTGATGCCCCATTGTATAGGAGTTTATCTAAGGGAACCCCCACCTTCACTGC 
03/CCCAGAAATATTGATGCCCCATCAAATAGGAGTTTACCTAAAGGAAACTCCACCTTCACTGC 
04/CCTGGAAATATTGATGACCCATCGTATAGGAGTTTTTCTAAAGGAAACCCCATTTTCACCAC 

01/CCACACCCATATGCCCCGCAACTGCTATCACTCTGCCACTCTTTGCATGCATGCAAATACTC 
02/CCACACCCATATGCCCCACAACTGCTATAACTCTGCCACTCTTTGCATGCATGCAAATACTC 
03/CCACACCCATATGCCCCACAACTGCTATAACTCTGCCACTCTTTGCATGCATGCAAATACTC 
04 /CCACACCTATATGACCC 

01/ATTATTGGACAGGAAAAATGATTAATCCTAGTTGTCCTGGAGGACTTGGAGTCACTGTCTGT 

0 2 / ATTATTGGACAGGAAAAACGATTAATCCCAGTTGTCCTGGAGG ACTTGG AG 

03/ ATTATTGGACAGGGAAAATGATTAATCCTAGTTGTCCTGGAAGACTTGG AGCCACTGTCTGT 
04/ 

01/ TGGACTTACTTCACCCAAACTGGTATGTCTGATGGGGGTGGAGTTCAAGATCAGGCAAGAGA 

02/ — GACTCACTTCACTCATACCAGTATGTCTGATGGGGGTGGAGTTCAAGATCAGGCAACAGA 

03/CGGACTTACTTCACCCATACTGGTATGTCTGAGGGGGGTGGAGTTCAAGATCAGGCAAGAGA 
04/ 

0 1 / AAAACATGTAAAAGAAGTAATCTCCCAACTCACCCGGGTACATGGCACCTCTAGCCCCTACA 

02/AAAACACATAAAGGAAGTAATCTCCCAACTGACCTGGGTACATAGCACCCCTGGCCCCTACA 

03/AAAACATGTAAAGGAAGTAACCTCCCAACTGACCCGGGTACATAGCACCCCTAGCCCCTACA 
04/ 

01/AAGGACTAGATCTCTCAAAACTACATGAAACCCTCCGTACCCATACTCGCCTGGTAAGCCTA 

02 / AAGGACTAGATCTCTCAAAACTACATGAAACCCTCCATACCCATACTGGCCTGGTAAGCCTA 

03/AAGGACTAGATCTCTTAAAACTACATGAAACCCTCCATACCCATACTTGCCTGGTAAGCCTA 
04/ 

01/ TTTAATACCACCCTCACTGGGCTCCATGAGGTCTCGGCCCAAAACCCTACT AACTGTTGGAT 

02/TTTAATACCACCCTGACTGGGCTCCATGAGGTCTCGGCCCAAAACCCTACTAACTGTTGGAT 

03/ TTTAATACCACCCTCACTGGGCTCCATGAGGTCTCGGTCCAAAACCCT ACT AACTGTTGGTT 
04/ 

01/ATGCCTCCCCCTGAACTTCAGGCCATATGTTTCAATCCCTGTACCTGAACAATGGAACAACT 
02/GTGCCTCCCCCTGCACTTTAGGCCATACATTTCAATCCCTATACCTGAACAATGGAACAACT 
03/GTGCCTCCCCCTGTATTTCAGGCCATGCATTTCAATCCCTGTACCTGAACAATGGAACAACT 
04/ TGCACTTCAGGCC AT ACATTTCAAT CCCTGTA 
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0 1 /TCAGCACAGAAATAAACACCACTTCCGTTTTAGTAGGACCTCTTGTTTCCAATCTGGAAATA 

02 /TCAGCACAGAAATAAACACCACTTCTGTTTTAGTAGGTCCTC TTTCCAATCTGGAAAT. 1 . 

03/ACAGCACAGAAATAAACACCACTTCCGTTTTAGTAGGACCTCTTGTTTCCAATCTGGAAATA 



0 1 /ACCCATACCTCAAACCTCACCTGTGTAAAATTTAGCAATACTACATACACAACCAACTCCCA 
02/ACCCATACCTCAAACCTCACCTGTGTAAAATTTAGCAATACTATAGACACAGCCAACTCCCA 
03/ACCCATACCTCAAACCTCACCTGTGTAAAATTTAGCAATACTGTAGACACAACCAACTCCCA 
04/ 

01/ATGCATCAGGTGGGTAACTCCTCCCACACAAATAGTCTGCCTACCCTCAGGAATATTTTTTG 
02/ATGCATCAGGTGGGTAACTCCTCCCACACGAATAGTCTGCCTACCCTCAGGAATATTTTTTG 
03/ATGCATCAGGTGGGTAACTCCTCCCACACGAATAGTCTGCCTACCCTCAGGAATATTTTTTG 
04/ 

01/TCTGTGGTACCTCAGCCTATCGTTGTTTGAATGGCTCTTCAGAATCTA7GTGCTTCCTCTCA 
02/TCTGTGGTACCTCAGCCTATCATTGTTTGAATGGCTCTTCAGAATCTGTGTGCTTCCTCTCA 
03/TCTGTGGTACCTTAGCCTATCGTTGTTTGAATGGCTCTTCAGAATCTATGTGCTTCCTCTCA 
04/ 

01/TTCTTAGTGCCCCCTATGACCATCTACACTGAACAAGATTTATACAGTTATGTCATATCTAA 
02/TTCTTAGTGGCCCCTATGCCCATCTACACTGAACAAGATTTATACAATCATGTCATACCTAA 
03/TTCTTAGTGCCCCC-ATGACCATTTACACTGAACAAGATTTATACAATTATGTTGTACCTAA 
04/ 

01/GCCCCGCAACAAAAGAGTACCCATTCTTCCTTTTGTTATAGGAGCAGGAGTGCTAGGTGCAC 
02/GCCCCGCAACAAAAGAGTACCCATTCTTCCTTTTGTTATTGGAGCAGGAGTGCTAGGCGGAG 
03/GCCCCACAACAAAAGAGTACTCATTCTTCCTTTTGTTATCGGAGCAGGAGTGCTAGGTGGAC 
04/ 

01/TAGGTACTGGCATTGGCGGTATCACAACCTCTACTCAGTTCTACTACAAACTATCTCAAGAA 
02/TAGCTACTGGCATTGGCGGTATCACAACCTCTACTCAGTTCTACTACAAACTGTCTCAAGAA 
03/TAGGTTCTGGCATTGGCGGTACCACAACCTCTACTCAGTTCTACTACAAACTATCTCAAGAA 
04/ 

01/CTAAATGGGGACATGGAACGGGTCGCCGACTCCCTGGTCACCTTGCAAGATCAACTTAACTC 
02/CTTAAAGGTGACATGGAATGGGTCGCTGATACCCTGGTCACCTTGCAAGATCAACTTAACTC 
0 3 /CTCAATGGTGACATGGAATGGGTTGCCGACTCCCTGGTCACCTTGCAAGATCAACTTAACTT 
04/ 

01/CCTAGCAGCAGTAGTCCTTCAAAATCGAAGAGCTTTAGACTTGCTAACCGCTGAAAGAGGGG 
0 2 /CCTAGCAGCAGT AGTCCTTCAAAATCGAAGAGCTTTAGACTTGCTAACCGCGG AAAGCGGGG 
03/CCTAGCATCAGTAGTCCTTCAAAATTGAAGAGCTTTAGACTTGCTAACCTCTGAAAGAGGGG 
04/ 

0 1 /GAACCTGTTTATTTTTAGGGGAAGAATGCTGTTATTATGTT 

02/GAACCTTTTTATTTTTAGAGGAAAAATGCTGTTGTTATGTT 

03/GAAGCTGTTTATTTTTAGGGGAAGAATGTTGTTATTATGTTATTTTAGCGGAAGAATGTTGT 
04/ — 

01/ AATCAATCCGGAATCGTCACTGAGAAAGTTAAAGAAATTCGAGATCGAATACA 

02/ AATCAATCCGGAATCATCACCGAGAAAGTTAAAGAAATTCAAGGTCGAATATA 

03/TATTATGTTAATCAATCCTGAATTGTCACAGAGAAAGTTGAAGAAATTCGAGATTGAATACA 
04/ --- 

01/ACGTAGAGCAGAGGAGCTTCGAAA-CACTGGACCCTGGGGCCTCCTCAGCCAATGGATGCCCT 
0 2 / ACGTAGAGCAAAGGAGCTGCAAAA-CACTGGACCCTGGGGCCTCCTCAGCCAATGGATGCCCT 
03/ACGTAGAACAGAGGAGCTTCAAAAACACCAGACCCTGGGGCCTCCTCAGCCAATGGATGCCCT 
04/ 
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01/GGATTCTCCCCTTCTTAGGACCTCTAGCAGCTATAATATTGCTACTCCTCTTTGGACCCTGTA 
02/GGATTCTCCCCTTCTTAGGACCTCTAGCAGCTATAATATTGTTACTCCTCTTTGGACCCTGTA 
03/GGATTCTCCCCTTCTTAGGATCTCTAGCAGCTCTAATATTGATACTCC7CTTTGGACCCTGTA 
04/ 

01/TCTTTAACCTCCTTGTTAACTTTGTCTCTTCCAGAATCGAAGCTG7AAAACTA 

02/TCTTTAACCTCCTTGTTAAGTTTGTCTTTTCCAGAATCGAAGCAGTAAAACTACAAATCGTTC 
03/TCTTTAACCTCCTTGTTAAGTTTGTCTCTTCCAGAATCAAAGTTGTAAAGCTACAAATCGTTC 
04/TCTTTAACCTCCTTGTTAAGCTTGTCTCTTGCAGAATCGAAGCTGTAAAACTACAAATGCTTG 

01/--CAAATGGAGCCCAAGATGCAGTCCAAGACTAAGATCTACCGCAGACCCCTGGACCGGCCTG 
02/TTCAAATGGAGCCCCAGATGCAGTCCATGAGTAAAATCTACCACGGACCCCTGGACCGGCCTG 
03/TTCAAATGGAACCCCAGATGAAGTCCATGACTAAGATCTACCGTGGACCCCTGGACCGGCCTA 
04/TTAAAATAGAGCCCCAGATGCAGTCCATGGCTAAGATCTACCACGGACCCCTGGACCGGCCTG 

01/CTAGCCCACGATCTGATGTTAATGACATCAAAGGCACCCCTCCTGAGGAAATCTCAGCTGCAC 
02/CTAGCCCATGCTCTGATGTTAATGACATCAAAGGCACCCCTCCCGAGGAAATCTCAACTGCAC 
03/CTAGCCCATGCTCCAATTGTAATGATATCGAACGCACCCCTCCCGAGGAAATCTCAACTGCAC 
04/CTAGCCCATGCTCTGATGTTGATGACATTGAAGGCACGGCTTCCGAGGAAATCTCAACTGCAC 

0 1 / AACCTCTACTACGCCCCAATTCAGCAGGAAGCAGTTAGAGCGGTCGTCGGCCAACCTCCCC 
02/AACCTCTACTACGCCCCAATTCAGCAGGAAGCAGTTAGAGTGGTTGTTGGCCAACCTCCCC 
0 3 / AACCCCTACTATGCCCCAATTCCGCAGGAAGCAGTTAGACTGGTCGTCAGCCAACCTCCCC 

04/GACCCCTACTACACCCCAATTTAGCGGGAAGCAATTAGAGCAGCCTATGGCCACCTCCCC 
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CTTCCCCAACTAATAAGGACCCCCCTTTCAACCCAAACAGTCCAAAAGGACATAGACAAAGGA 3 

CTTCCCCAACTAATAAGGACCCCCCTTTCAACCCAAACAGTCCAAAAGGACATAGACAAAGGA 4 

CTTCCCCAACTAATAAGGACCCCCC-TTCAACCCAAA7GGTCCAAAAGGAGATAGACAAAAGG 5 

CTTCTCCAACTAATAAGGACCCCCC-TTCAACCCAAATGGTCCAAAAGGAGATAGACAAAGGG 6 

CTTCCCCAAATAATAAGAACCCCCC-TTCAACCCAAACGGTCCAAAAGGAGATAGACAAAGGG 7 

GTAAACAATGAACCAAAGAGTGCCAATATTCCCTGGTTATGCACCCTCCAAGCGGTGGGAG— 3 

GTAAACAATGAACCAAAGAGTGCCAATATTCCCTGGTTATGCACCCTCCAAGCGGTGGGAG-- 4 

GTAAACAGTGAACCAAAGAGTGCCAATATTCCCCAATTATGACCCCTCCAAGCAGTGGGAGGA 5 

GTAAACAATGAACCAAAGAGTGCCAATATTACACGATTATACTCGCTCCAAGCAGTGGGAG-- 6 

GTAAACAACTAACCAAAGAATGCCAATATTCCCCGATTATGCCCCCTCCAAGCGGTGGGAG-- 7 

A-AGAATTCGGCCCAGCCAGAGTGCATGTACCTTTTTCTCTCTCAC-ACTTGAAGCAAATTAAA 3 

A-AGAATTCGGCCCAGCCAGAGTGCATGTACCTTTTTCTCTCTCAC-ACTTGAAGCAAATTAAA 4 

AGAGAATTCGGCCCAGCCAGAGTGCATGTGCCTTTTTCTCTCCCAG-ACTTAAAGCAAATAAAA 5 

-GAGAATTTGGCCCAGCCAGCGTGCATGTACCTTTTTCTCTCTCAG-ATTTAAAGCAAATTAAA 6 

-GAGAATTCGGCCCAGCCAGAGTGCACGTACCTTTTTCTCTCTCTAGACTTTAAA TTAAA 7 

ATAGACNTAGGTNAATTNTCAGATAGCCCTGATGGYTATATTGATGTTTTACAAGGATTAGGA 3 

ATAGACXTAGGTXAATTXTCAGATAGCCCTGATGGXTATATTGATGTTTTACAAGGATTAGGA 4 

ACAGACTTAGGTAAATTCTCAGATAACCCTGATGGCTATATTGATGTTTTACAAGGGTTAGGA 5 

ATAGACCTAGGTAAATTCTCAGATAACCCTGATGGCTATATTGATGTTTTACAAGGGTTAGGA 6 

ATAGACCTAGGTAAATTCTCAGATAACCCTAATGGCTATATTGATGTTTTACAAGGTTTAGGA 7 

TTCCTGAGTTCTTGCACTAACCTCAAAT 1 

CAATCCTTTGATCTGACATGGAGAGATATAATATTACTGCTAAATCAGACGCTAACCTCAAAT 3 

CAATCCTTTGATCTGACATGGAGAGATATAATATTACTGCTAAATCAGACGCTAACCTCAAAT 4 

CAATTCTTTGATCTGACATGGAGAGATATAATGTCACTGCTAAATCAGACACTAACCCCAAAT 5 

CAATCCTTTGATCTGACATGGAGAGATATAATGTTACTGCTAAATCAGACACTAACCCCAAAT 6 

CAATCCTTTGATCTGATATGGAGAGATATAATGTTACTGCTAAATCAGACACTAACCCCAAAT 7 

GAGAGAAGTGCCGCCATAACTGCAACCCAAGAGTTTGGCGATCCCTGGTATCTCAGTCAGGTC 1 

GAGAGAAGTGCTGCCATAACTGGAGCCCGAGAGTTTGGCAATCTCTGGTATCTCAGTCAGGTC 3 

GAGAGAAGTGCTGCCATAACTGGAGCCCGAGAGTTTGGCAATCTCTGGTATCTCAGTCAGGTC 4 

GAGAGAAGTGCCACCATAACTGCAGCCTGAGAGTTTGGCGATCTCTGGTATCTCAGTCAGGTC 5 

GAAAAAAGTGCTGCCATAACAGCAGCCTGAGAGTTTGGCGAACTCTGGTATCTCAGTCAGGTC 6 

GACAGAAGTGTCGCCGTAACTGGAGCCCGAGAGTTTGGCAATCTCTGGTATCTCAGTCAGGTC 7 

AATGACAGGATGACAACAGAGGAAAGATAATGATTCCCCACAGGCCAGCAGGCAGTTCCCAGT 1 

AATGATAGGATGACAACGGAGGAAAGAGAACGATTCCCCACAGGGCAGCAGGCAGTTCCCAGT 3 

AATGATAGGATGACAACGGAGGAAAGAGAACGATTCCCCACAGGGCAGCAGGCAGTTCCCAGT 4 

AATGATAGGATGACAACAGAGGAAAGAGAATGATTCCCCACAGGCCAGCAGGCAGTTCCCAGT 5 

AATGATAGGATGACAACAGATGAAAGAGAATGATTCCCCACAGGCCAGCAGGCAGTTCCCAGT 6 

AATGATAGGATGACAACAGAGGAAAGAGAACGATTCCCCACAGGCCAGCAGGCAGTTCCCAGT 7 

GTAGACCCTCATTAGGACACAGAATCAGAACATGGAGATTGGTGCCGCAGACATTTGCTAACT 1 

AACT 2 

GTAGCTCCTCATTGGGACACAGAATCAGAACATGGAGATTGGTGCCGCAGACATTTACTAACT 3 

GTAGCTCCTCATTGGGACACAGAATCAGAACATGGAGATTGGTGCCGCAGACATTT 4 

CTAGACCCTCATTGGGACACAGAATCAGAACATGGAGATTGGTGCTGCAGACATTTGCTAACT 5 

GTAGACCCTCATTAGGACACAGAATCAGAACTTGGAGATTGGTGCCACAGACATTTGCTAACT 6 

GTAGACCCTCACTGGGACACAGAATCAGAACATGGAGATTGGTGCCGCAGACATTTGCTAACT 7 
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TGCGTGCTAGAAGGACTAAGGAAAACTAGGAAGA TATGAATTATTCAATGATGTCCACT 1 

TGCGTGCTAGAAGGACTAAGGAAAACTAGGAAGA CTATGAATTATTCAATGATGTCCACT 2 

TGCGTGCTAGAAGGACTAAGGAAAACTAGGAAGA CTATGAATTATTCAATGATGTCCACT 3 

TGTGTGCTAGAAGGACTAAGGAAAACTAGGAAGAAGTCTATGAATTACTCAATGATGTCCACA 5 

TGCGTGCTAGAAGGACTAAGGAAAACTAGGAAGAAGCCCATGAATTATTCAATGATGTCCCCT 6 

TGCGTGCTAGAAGGACTAAGGAAAACTAGAAAGAAGCCTGTGAGTTATTCAATGATGTCCACT 7 

ATAACACAGGGGAAAGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAGGCATTGAG 1 

ATAACACAGGGGAAAGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAGGCATTGAG 2 

ATAACACAGGGGAAAGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAGGCATTGAG 3 

ATAACACAGGG-AAGGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAGGCATTGAG 5 

ATAACACAGGG-AAAGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAAGGATTGAG 6 

AT AAC AC AGGG - AAAGG AAGAAAAT CC T AC C GCC TTTCTGG AG TG AC TAACGG AG GC AT TG AG 7 

GAAGCATACC AGGCAAGTGGACATTGGAGGCTCTGGAAAAGGGAAAAGTTGGGAAAAGTA 1 

GAAGCATACC AGGCAAGTGGACATTGGAGGCTCTGGAAAAGGGAAAAGTTGGGCAAATTG 2 

GAAGCATACC AGGCAAGTGGACATTGGAGGCTCTGGAAAAGGGAAAAGTTGGGCAAATTG 3 

GAAGCGTGCC2 3 2 AGGCAAGTGGACTTTGG AGGCTCTGGAAAAGGGAAAAGCTGGGCAAATTG 5 

GAAGCATACC2 3 8 AGGCAAATGGACTTTGGAGGCTCCAGAAAAGGGAAAAGCTGAGCAAATTG 6 

GAAGCATACC2 3 3AGGCAAGCGGACTTTGGAGGCACTGGAAAAGGGAAAAGCTAGGCAAATCA 7 

TATGTCTAATAGGGCTTGCTTCCAGTGTGGTCTACAAGGACACTTTAAAAAAGATTGTCC-AA 1 

AATGCCTAATAGGGCTTGCTTCCAGTGCAGTCTACAAGGACGCTTTAGAAAAGATTGTCC-AA 2 

AATGCCTAA 3 

AATGCCTAATAGGGCTTGCTTCCAGTGCGGTCTACAAGGACACTTTAAAAAAGATTGTCC-AA 5 

AATGCCTAACAGGGCTTGCTTCTAGTGTGGTCTACAAGGACACTTTAAAAAAGATTGTCC-AA 6 

AATGCCTAATAGGGTTTGCTTCCAGTGCGGTCTACAAGGACACTTTAAAAAAGATTGTCCAAA 7 

-TAGAAATAAGCCACCACCTCGTCCATGCCCCTTATGTCAAGGGAATCACTGGAAGGCCCACT 1 

GTAGAAATAAGCCGCCCC-TCGTCCATGCCCCTTATGTCAAGGGAATCACTGGAAGGCCTACT 2 

GTAGAAGTAAGCCGCCCCCTCGTCCATGCCCCTTATTTCAAGGGAATCACTGGAAGGCCCACT 5 

GTAGAAACAAGCTGCCCCCTTGTCCATGCCCCTTATGTCAAGGGAATCACTGGAAGGCCCACT 6 

-TAGAAATAAGCCGCCCCCTCGTCCATGCACCTCGTGTCAAGGGAATCACTGTAAGGCCCACT 7 

GCCCCAGGGGATGAAGGTCCTCTGAGTCAGAAGCCACTAACCAGATGA 1 

GCCCCAGGGGACGAAGGTCCTCTGAGTCAGAAGCCACTAACCTGATGA 2 

GCCCCAGGGGACAAAGGTCCTCTGAGTCAGAAGCCACTAACCAGATGA 5 

GCCCCAGGAGATGAAGGTCCTCTGAGTCAGAAGCCACTAACCAGATAA 6 

GCCCCAGGGGACGTAGGTCCTCTGAGTCAGAAGCCACTAACCAGATGA 7 
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RT PLSTQTVQKDI DKGVNNEPKSAN I PWLCTLQAVGEEFG PARVHVPFS LS KLKQ Z KI DG SDSPZ; 
KDPPSTQMVQKEIDKRVNSEPKSANIPQLPLQAVGGREFGPARVHVPFSLPDLKQIKTDLGKFSDNPC: 
YIDVLQGLGQSFDLTWRDI ILLLNQTLTSNERSAAITGAREFGNLWYLSQVNDRMT7EERERFPTGQQ 
YIDVLQGLGQFFDLTWRDIMSLLNQTLTPNERSATITAAXEFGDLWYLSQVNDRMTTEEREXFFTGQC 
AVPSVAPHWDTESEHGDWCRRHLLTCVLEGLRKTRK TMNYSMMST ITQGK 
AVPSLDPHWDTESEKGDWCCRHLLTCVLEGLRKTRKKSMNYSMMSTITQGR 
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GTCTACCTAGCCA-AGGCATATTCTTCTTATGTGC-AACATCAACCTATATCTGCCTC-CCACy.-ACTC-GA 

GTCTGCCTACCCTCAGGAATATTTTTTGTCTGTGGTACCTCAGCCTATCGTTG7TTGA--A-TGGCTCTT 
CAGGCACC-TGAACCTTAGTCT— TTCTAAGTCCCAAC-ATTAACATTGCCCCAGGAAATCAGACv-'^-TA 

CAGAATCT a TGTGC-T?CCTCTCATTCTTAGTGCCCCCTATGACCATCTACACTGAACA AGATTTATA 
TTGGTACCTGTCAAAGCTAAAGTCCCGTCAGTGCAGAGCCATACAACTAATATCCCTAT-TTATAGGuTT 

CAGTTA--TGTCATATCTAA-GCCCCGCAACAAAM 

AGGAATGGCTAC-TGCTAC-AGGAACTGGAATAGCCGGTTTATCTACTTC-ATT-A-TCCTAC inCC.-VTA 

AGGAGTG-CTAGGTGC-ACTAGGTACTGGCATTGGCGGTATCACAACCTCTACTCAGTTCTACTACA.A-A 
CACTCTCAAJ\GAATTTCTCAGACAGTTTGCAAGAAATAATGAAATCTATTCTTACTTTACAAiCCCAA-T 

CTATCTCAA^AACTAAATGGGGACATGGMCGGGTCGCCGAC-TCCCTGGTCACCTTGCAAGATCAACT 
TAGACTCTTTGGCAGCAAT-GACTCTCCAAAACCGCCGAGGCCCACACCTCCTCACTGCTGAGA.AAo.AG 

ta-ACTCCCTAGCAGCAGTAGTC-CTTCAAAATCGAA 

GACTCTGCACCTTCTTAGGGGAAGAGTGTTGTTTTTACACTAACCAGTCAGGGATAGT-AC-umG^T-uC 

GAACCTGTTTATTTTTAGGGGAAGAATGCTGTTATTATGTTAATCA.ATCCGGA.ATC3TCACTGAGAAA.GT 
CACCTGGCATTT-ACAGGAAAGGGCTTCTGATATCAGACAATGCCTTTCAAACTCTTATACCAA---CCT 

T AAA-GAAATTCGAGATCGAATA-CAACGTAGAGCAGAGGA-GC-TTCGAAACACTGGACCCTGGGGCCT 
CTGGAGT— TGGGCAACATGGCTTCTTCCATTTCTAGGTCCCATGGCAGCCATCTTGCTGTTACTCACC 

CCTCAGCCAATGGATGCCCTGGATTCTCCCCTTCTTAGGACCTCTAGCAGCTATAATATTGCTACTCCTC 
TTTGGGCCCTGTATTTTTAAGCTTCTTGTCAAATTTGTTTCCTCTAGGATCGAAGCCATCAAGCTACAGA 

TTTGGACCCTGTATCTTTAACCTCCTTGTTAACTTTGTCTCTTCCAGAATCGAAGC T G-TAAA-A 
TGGTCTTACAAATGGAACCCCAAATG-AGTTCAACTAACAACTTCTACCAAGGACCCCTGGAACGATCCr, 

CT-ACAAATGGAGCCCAAGATGCAGTCCAAG-ACTAAGATCTACCGCAGACCCCTGGACCGGCCTG 

CTGGC ACT-TCC-AC-T-A — GCC-T-AGAGATTCCCCTCTGGAAGACA-CTACAACTGCAGGGCCCC 

CTAGCCCACGATCTGATGTTAATGACATCAAAGGCACCCCTCCTGAGGAAATCT-CAGCTGCACAACCTC 
TTCTTTGCCCCTATCCAGCAGGAAGTAGCTAGAGCGGTCATCGGCCAAATTCCC-AACAGCAGTTGGGGT 

TACTACGCCCCAATTCAGCAGGAAGCAGTTAGAGCGGTCGTCGGCCAACCTCCCCAACAGCACTTAGGTT 
GTCCTGTTTAGAGGGGGG 

TTCCTGTTGAGATGGGGG 
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ACCTTGC AAGATCAACTTA - ACT C C C T AGC AG C AG T - AGTCCTTCAAAATCG AAGAGCTTTAGACTTGCT 

ACTTTACAATCCCAAATAAGACTCTTTGGCAGCAGTGACTC-TCCAAAACCGCTGAGGCCTAGATCTCCT 
AACCGCTGAAAGAGGGGGAACCTGTTTATTTTTAGGGGAAGAATGCTGTTATTATGTT.^TCAATCCGGA 

CACTGCTGAAAAAGGAGGACTCTGCACCTTCTTAGGGGAAGAGTGTTGTTTTTACACTAACCAGTCAGGG 
ATCGTCAC TG AGAAAG T T AAAG AAAT T CG AG AT CG AAT A - - CAACGTAGAGCAGAGGAGCTTCGAAACAC 

ATAG - CA-TGAGAT - GCCACCCAGCGTTTACAG - GAAAAGGCTTCTG AAATCAGACGCCTTTC - AAATTC 
TGGACCCTGGGGCCTCCTCAGCCAATGGATGCCCTGGATTCTCCCCTTCTTAGGACCTCTAGCAGCTATA 

TTATACCAA- - - C CT CTGG AG T - - -TGGGCAACATGGCTTCTCCCCTTTCTAGGTCCCGTGGCAGCCATC 
ATATTGCTACTCCTCTTTGGACCCTGTATCTTTAACCTCCTTGTTAACTTTGTCTCTTCCAGAATCGAAG 

TTGCTGTTACTCGCCTTTGGGCCCCGTATTTTTAACCTTCTTGTCAAATTTGTTTGGTCTAGAATCGAGG 
C - -T- - -G-TAAA-A CT - AC AAATGG AGC C C AAG AT G C AGTC C AAG - AC T AAG AT C T AC C G C AG AC 

C CAT C AAGC T AC AG ATGGTCTT AC AAAT CG AAC C C C AAATG - AGTTCAACTAACAACTTCTACCG AGGAC 
C C CTG G AC CGGC C TG CT AGC C C AC G ATCTG ATGTT AATG AC ATC AAAG - GC ACCCCTCCTGA - GGAAATC 

CCCTGGACTGACCAGCTGGC - - ACT - TCCCCTG GCC - T - AGAGAGTTCCCCTC - TGAAGGACA - C 

T-CAGCTGCACAACCTCTACTACGCCCCAATTCAGCAGGAAGCAGTTAGAGCGGTCGTCGGCCAACCTCC 

TACAACTGCAAAGCCCCTTCTTCGCCCCTATCCAGCAGGAAGTAGCTAGAGCAGTCATCGGCCAAATTCC 
CCAACAGCACTTAGGTTTTCCTGTTGAGATGGGGG 

C - AACAGC AGTTGGGGTGTCCTGTTGAT - TGAGGG 
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agttgcaattccttgcctcaactctgagagaaaccc^ 

agttgcaattccttg^ 2299 
acctcaaaacacctgaactgcagcagccaggcgttcccccaggaccacctccc^ 

Icttcgiiitgcctciacctcaggtgccaggggttcctccagaaccttctcccccaggag 2 3 59 

cttgcttcaagtgccggaaatctgaccattgggccaaggaacgcctgcagcccaggattc 

HUM IMIIIII 1 II 1 1 i 1 1 III IMMMMMHII III IIMIIIM 

cttgctacaagtgccagaaatctggccactgggccaaggaatgcccacagaccaggattc 
ctcctaagccacgtcccatttgtgcaggaccccactggaaatcggactgtccaactcacc 

Miiiiiii mini i ii iimmii inn hum iiiiiiin 

ctcctaagctgtatcccatctctgtgggaccccactaaaaatcagactgctcaactcacc 
cggcagccaatcccagagcccctggaactctggcccaag^ 

tggcagccacttccagag^ 2539 
cagatcttctcggcttagcagctgaagactgacactgcccg^^ 

gagatctteLtggcttag^ 2 5 99 

ggaccatcacggatactgagcttcaggtaactctcacagtggaggctaagtcca^ 

ggicciciliajlt gctccaggtaactctcacagtagagggtaagtctgtcccct 26 54 

gtttaatcgatacaggggctacccactccacatcaccttcttttcaagggc^ 
tcttaatcaatatggaggctacccactgcacattacct 2714 
^^.t:eecc■cataactattqtgggtattgacggccaagcttcaaaaccccttaaaactcccc 

II || MlllllllllllillilllllllllM Mill Hill IMIIIIIMIM 

ttgcctccataactgttgtgggtattgacggccaggcttctaaacctcttaaaactcccc 2774 
cactctggtgccaacttggacaacattcttttatgcactctttttcagttatcc^ 

aactctagtaccaac^ 2834 
gcccagttcccttattaggccgagacattttaaccaaattatctgctt^ 

gcccagttccctt^ 

ctgggctacagccacatctccttgccgcccttcttcccaacccaaagcctc^ 

ctggactacagct^ 
ttcctctcatatccccccaccttaacccacaagta^ 

ttcttgt---atcccccaaccttaacccacaagtata^ 3011 
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caaccgatcacacgcccactactatcccactaaaacctaaccaccctcaccctgcccaat 
tgaccaatcatgcaccccttaccatctcattaaaacctaatcactcctacccggctcaat 3 0 71 
gccagtatcccataccacaacaggctttaaagggattgaagcctgttatcacttgcccgc 

mi niiiM urn ii minim Mill ii minimum iimii 

gccaagatcccatcccacagcatgctttaaaaggactaaaacctgttatcactcgcctgc 3131 
tacagcacgggcttctaaaacctataaactctccatacaattcccccattttacctgtct 

II 1 1 1 1 || III MM IIIIIIIMMMI MIMIIIIIilllllllllMII 

tagagcatggccttttaaagcctataaactccccttacaattcccccattttacccgtcc 3191 
aaaaaccagataagtcttacaggttagttcagaatctgcaccttaccaaccaaattgttt 

tagaaccagacaagccttacaggtt caggatctgtgtcttatcaatgaaattgttt 3 24 7 

tgcctatccaccctgtagcacccaactcgtacactcttctgtcctcaatgccctccccca 

I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I III ! II Mill I III Mill Ml II I I 

tccctatccaccctgtggtgctgaacccatatactctcctatcctcaatacctccctcta 3 3 07 
caactcactattccgttcttgatcttaaagatgcttttttcaccattcccccgcacccct 

1 1 1 1 II Mill Mill Mill Ml I M Mill II I IMM I 

caacccattattctgttctagatctcaaacatgctttctttactatccctttacaccctt 3 367 
catcccagcctctctttgcttttacctggactgaccctgacacccatcagtcccagcagc 

II IIMIIIMIIII I Ml MMIIMIMMIIMIIMIMIMIIMMIMI 

caacccagcctctcttcgttttcacccggactgaccctgacacccaccagtcccagcagc 3427 
ttacctgggctgtactgccgcaaggcttcagggacagccctcattacttcagccaagctc 

llllllllllllll III MIMI MMIM 1 1 1 1 1 1 1 MM 1 1 1 i M 1 1 1 1 1 II 

ttacctgggctgtaatgctgcaaggtctcaggggcagcccttattatttcagccaagctc 348 7 
tttctcatgatttactttctttccacctctctgcttctcaccttattcaatatattgatg 

Ml I II Ill III 111111111111 111111111111 II 

tttcccatgatttactttctttccacccctccacttctcaccttattcaatatattggtg 3 54 7 
accttctactttgtagcccctcctttaaatcttctcaacaagacaccctcctgctccttc 

i mi iiiiiiiiiii i mi niiiinn u niinini 

atgttcttctttgtagcccctcctttgaatcttctcaacaagacacacttctgctccttc 36 07 
aacatttgttctccaaaggatatcgggtatccccctccaaagctcaaatttcttctccat 

I mil IMIIIIIIMMMI M M 1 1 1 M I II I II 1 1 1 IMIIMMI 

agcatttattctccaaaggatatc-- cccctccaaagctcaaatgtcttctccat 3660 

ctgttacatacctcggcataattcttcatgaaaacacatgtgctctccctgccaattgcg 

i inn inn nnnnninn innin nn innni n i i 

ccgttacctaccttggcataattcttcataaaaacacacgtgccctccctgctgatagtg 3 720 
tctccaactgatctctcaaatcccaacctcttctacaaaacaacaactcctttccctcct 

in niiiniinin innn iinninniinnni inn i 

tctg- -actgatctctcaaaccccaaccccttctacaaaacaacaactcttttccatcct 3 77 8 
aggcatggttggatacttttgcctttggatacctggttttgccatcctaacaaaatcatt 

1 1 1 1 1 1 i i ii 1 1 1 1 1 1 1 1 1 i n 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 nn 

aggcacggttggatactttcgtgttaggatacctggttttgccatcctaacaaaaccatt 3 83 8 
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atataaactcacaaaaggaaacctagctgaccccatagattctaaatcctttccccactc 

llllllllllllllMlllllllil! IMIIMMMH 1 1 ! M 1 1 IMIMMIM 

atacaaac tcacaaaaggaaacc cagt cgaccccataga t cc taaa tec tttccccaccc 3 8 98 
ctctttccattccttgaagacagctt tagagactgctcccacactagctctccctgtctc 
ctctttccattccttgaagacagctttagagactgtctccaccccagctctccctgactc 3 9 58 
atcccaacccttttcattacacacagccgaagtgcagggctgtgcagtcggaattcttac 

IMIMM MIIMIIIIMIMIII MMMIMIIMMIIIMI IMMMMI 

atcccaacacttttcattacacacagctgaagtgcagggctg-gcagtcagaactcttac 4 018 
acaaggaccgggaccatgccctgtagcctttttgtccaaacaacttgaccttactgtttt 

IIIIIIIIMIII I MI!IIIIIII!IIIII!III!!I!IIIMII!IMIIMI 

acaaggaccgggatcgcatcctgtagcctttttgtccaaacaacttgaccttactgtttt 4 0 78 
aggctcgccatcatgtctccatgcggtagcttccgctgccctaatacttttagaggccct 

Mill IIIMIIMIMIIMII ! IMI! 1 1 1 1 1 1 1 1 1 i 1 1 II 1 1 1 1 1 1 1 1 

aggctggccatcatgtctccatgcagcgtctgctgccaccctaatacttttagaggccct 4138 
caaaatcacaaactatgctcaactcactctctacagctctcacaacttccaaaatctatt 

llllllllllllllllimillll! I 1 ■ ! ! I i II IIIMIIIIIIIII 

caaaatcacaaactatgctcaactcattctctacagctctcataatttccaaaatctatt 4198 
ttctttctcacacctgacgcatatactttctgctccccggctccttcagctgtattcact 

Mill IIIIIIIIIMI IIIMIIIIIIIIIIMIMIIIilllMI I II Mill 

ttcttcctcacacctgacacatatactttccgctccccggctccttcagatatactcact 4 2 58 
ctttgttgagtctcccacaattaccattcttcctggcccagacttcaatctggcctccca 

I M I I i 1 1 1 1 1 1 i 1 1 i i I E 1 1 1 MM I llllllllll IMIIIMI 

c- -catttattctcccacaattaccattattcctggcctggacttcaatccggcctccca 4 316 
cattattctggataccacacctgaccctgatgattgtatgtctctgatctacctgacatt 

IMIMIMIIIIIIII IMIMIMI 1 1 II II M IIIIIMM IMIMI II 

caetattctggataccatacctgaccctcatgactgcatctctctgatccacctgacgtt 4 376 
caccccatttccccatatttccttcttttctgttcctcatgttgatcacatttggtttac 

IIIIIMIIIIIIM MIMIMII Mill IMI IMIMI! I Mi 

caccccatttccccacatttcctcctgccctgtttctcaccctgatcacacttggtttat 44 36 
tgacggcagttccaccaggcctgatcgccactcaccagcaaaggcaggctatgctat 

Ml MIIIIIIMMIIMM MIMMMMMMIIMIMIM MIIIMI 

tgatggcagttccaccaggcctaatcgccactcaccagcaaaggcaggatatgctat 44 93 
gaactgattgccttaactcgggccttcactcttgcaaagggactacacgtcaatatttat 

Hill IMIIIMI II III IMIMMIMM IMIMI MIIIMI Ml 

gaactagttgccttaattcaagccctcactcttgcaaaaggactacgtgtcaatatctat 4 553 
actgactctaaatatgccttccatatcttgcaccaccatgctgttatatgggctgaaaga 

Mill II i 1 1 1 1 1 : 1 1 i I 1 1 II I MMMMIMM II IMIMMMIMM 

actgattctaaatatgcctttcatattctgcaccaccatgcggtcatatgggctgaaaga 4 613 
ggtttcctcactacgcaagggtcctccatcattaatgcctctttaataaaaactcttctc 

IIIIIIMIIIIII I II I IT M 1 M 1 M 1 1 1 1 i 1 1 1 M 1 1 1 S II MM 1 1 1 1 III 

ggtttcctcactacacaagtgccccccatcattaatgcctctctaagaaaa-ctctgccc 46 72 
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aaggctgctttacttccaaaggaagctggagtcacacactgcaagggccaccaaaaggcg 

. * - > > . . . . i ... * * t i i i i i i j t i i i i i ii i i i j * i i 



aaggctgctttacttccaaaggaagctggggtcactcaccgcaaggggcaccaaaagact 4 7 32 
tcagatcccattactctaggaaatgcttatgctgataaggtagctaaagaagcacctagc 
tcagatcccattgctctaggcaatgcttatgctgataaggtggctagacaagcagctagc 4 7 92 
gttccaacttctgtccctcatggccagtttttccccttcccatcagtcactcccacctac 
tctccaacttttgtccctcatggccagtttttctccttcacatccgtcactcccacctac 4 8 52 
tcccccattgaaacttccgcctatcaatctcttctcacacaaggcaaatggttcttagac 
tccacagctgaaacttccacctaccaagctcttcccccgcaaggtaaatggttcttagac 4 912 
caaggaaaatatctccttccagcctcacaggcccattctattctgtcaccanttcataac 
caaggaaaatatctccttccagcctcacaggcccattctattctgtcgtcatttcataac 4 972 
ctcttccatgtaggttacaagccactagtccacctcttagaacctctcatttcctt-cca 
cttttccatgtaggttacaagccactagcctgtctcttaggacctctcattccctttcca 5 0 32 
tcgtggaaacatatcctcaaggaaatcacttctcagtgttccatctgctattctactacc 
tcatggaaatctatcctcaaggagatcacttctcagtgttccatctgctactctgctacc 50 92 
cctcagggattgttcaggccccctcccctccctacacatcaagctcggggacttgcccct 
cctcagggattgttcaggcctcctccctttcctacacataaagctcggggatttgcccct 5152 
gcccaggactggcaaattgactttactcacatgccctgagtcaggaaactaaaatacctc 
gcccaggactggcaaattgactttactcacatgcctcgggtcagaaaactaaaatatctc 5212 
ttggtctgggtagacactgtcactggatgggtagaggcctttcccacagggtctgagaag 
ttagtctgggtagacactttcactgggtgggtagaggcctttcccatagagtctgagaag 52 72 
gccactgcagtcatttcttcccttctgtcagacataattccttgggttggccttcccacc 
gccaccgcggtcatttcttcccttctgtcagacataattccttggtttggccttcccttc 53 32 
tctatacagtccaataacggagcagcctttattagtcaaatcacctgagcagtttttcag 
tctatacagtctgataacggaccagcctttactagttaaatcacccaagcagtttctcag 53 92 
gctcttggtattcagtggaaccttcgtaccccttactgtccccaatcttcaggaaaggta 
gctcttggtattcagtggaaccttcatatcccttaacatcctcaatcttcaggaaaggta 54 52 
gaatggactaatggtcttttaaaaacacaccccaccaaactcagcctccaacttaaaaag 



aaaccgactaatggtcttttaaagacacacctcaccaagctcagcctccaacttaaaaag 5512 
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TGCCTTTATTTCCGTAGGCTGGTCATATGGCGCTAGCACTCACATAAAGCTACCGAGGAG 
AG CG AATGAAACCAAAATCACTTT AC CTTCACAGCACGAGGCCGTCGTCCCTCTCG AT AT 
TTGGCCCGTGTGTCGCATACCGCCCTCTGGACGTGGTGATCAAATAAACTCCCTAGCTCC 
CCGCCGCTCGACGCCATCTTGCCTACTTTGATCCTCGCAGGGAGGACAACATCCGCCCTA 
C T G AGCT C C C TT TT AT C C AAT AAG AG AG C G GG ATG AG TT AAGG AGT G C C AG G AT TG G C TG 
GAGAATCGACAGCGTCGGCCATCGTTTCCTGCGTGCGAAGATTTGATGAACGAGGTGCCG 
CCCCCGAGCGGCTCGGCGGAGAGGCGCGGTGGGTGACAGAAGCTTTCTTGTCCCACCCAC 
TACAGGCTTACGGCAGGATGCGCAGCGGGGAGAGGGGGCGGGGCCGCAGGGGGCGGGGCC 
GATCGATCTCCTCCGGCTCCGACGTCCTCGGCCTG CCGGGTCCCGGGTCCTTTGCGGCGC 
TAGGGTGGGCGAACCCAGAGCGACGCTCCGGGACGATGTGGGGCAGCGATCGCCTGGCGG 
GTGCTGGGGGAGGCGGGGCGGCAGTGACTGTGGCCTTCACCAACGCTCGCGACTGCTTCC 
TCCACCTGCCGCGGCGTCTCGTGGCCCAGCTGCATCTGCTGCAG GTAACCTGCCGGCCCC 
GAGCCACCTGATCTTCAGCCTGGGGTCGGACGAGGCCGAAGCCTCTCAGGGACGCGGCGG 
GACACCGGCTGCCACCCGGGCGCCGCCGAAGCGCGCAGAGATCAGGGTCCCTCGACGGCA 
GGGCCCTTCTGGGTAGTCTCTGGATCCCACAAGTCCAGTGCAGCCCTGGGCTCGTCTTAT 
CCCAGGTCTTTTCACTTGGTGAAACTGAACCTAGAAACGTCCTAATATTCTACCACTGTT 
TTTAT AAAT ATT C CTT ATTC C AGG C TG G AAAAG CTC C TG AG AAGTG G TTTG TT T TT ATT A 
TTTTAAAAGGTGTTTTCCTTGCCAGCCATTTCCAGTTAACCTGCGCTGCTGCCGTCCGGG 
CCGCGAGAGCGGGACGCAGAGTTGTTGGCGGAGCCCCTGTCGGTTCCCGGGGACTAAGCA 
CCGCGTCCCATGAGCGGGAAAGGTTAATACAATGATGGTTCTGCCCTGCGTCGCTGACGC 
GGAACACAGCTGTAGTGTGTTAGGAACACATAACGTAGTTAAGATCACTTGAAGCTCTGC 
GATCAGTCGCCCTTCTGGACGTTGTGGTTAGGATGTTTCACAGTTCTAACCACTGGTGGA 
GATACAGCGTCCATATTTTCATAATTAAAAATAGAGGCACATGGTCTCACGAGTTTGAGT 
GTACTT ATGG GGGCAAAAGGACGGCGTATTTG AAAT C CTC AT AAAT CCTGG ATG CATGGT 
ACCCACCAGTGGCTAATCTATGCAATGAATAGAGTTTGCAATAATTTCAAGCATCCCTTC 
TTTCCACTTGAGTTACTTCCCCATACCTAGGGGAAGATATTTTTGGTCCACTGAAAACAT 
GAGTTCAGCAGAATCCTCCTATCATCGTCGTTATTATTTTTTACCACTAAGTAGACAATC 
TTTTGGTTTTTGATGGGCTTTATGGCTAGAGACAAATCAGTCACTGTCACCAAGTTCCAG 
GTAGAAGTTGGTTCAGTGCTCTGTCAGCTTCGATGGGATTTTTCAACATGTTTTCAAATC 
TGCACTTAATAGTAGGAATGCTTTCTTACAGTAACTCTAATTTGATCCTAAGATGTAGTT 
GTTACCTTACATT CAT CACTGTTTAAGAATTTAGTGGTCTTGATC TTTG TTTTAAATTTT 
GAGCCTTCGGGAAGTACTTATAAGAATTAATTCATGCATATCTTTTTGAAATGTAAATGT 
CTTTAGCCCTGGAACAAATTGCTGTTTCTGTTCAGCCCATATTAGCAGAATAGGTCAACT 
TT ACTTT CT AATT AT C AATGT AATAAGTTT ATTACTTT AT AG ATT C CAT AAAT CT AT AC A 
TTTATTCCTCGATGAATTATATAAATTTATAGAATTTATGTTTTATAGAAAATTTGGAAA 
GCATGGAAAATT ATT AAC AAGAAAAT AAGTT AC CCAT AATC C C AG AACTT AG AGG T GAC T 
AATGTTGACAGTTTGGATCAAATCTTCCAGTTTTGTTTCTAATCTTTATTTTTAACATAA 
ATGAGGT CCTG TAT AC AC ACGT ACAGTTTTG TGTCC TGGTGTTTTT ATTT AATGTT ATT A 
TGAGTGTTTTATTTTGTTAAAAGGTCATCATTTTAAGTTGTTAATTAGTATTCTAGCACA 
AATTTGCCATAATTTATTTAATTGTTTACTATGATTGACCATTTAGATTGTACTTAATTT 
TTAGG CATT AGAAGT GATAAACT AT ATTTTAAT C AG ACG TTGAAAAT AAC ACAT C TTTGT 
TTAGAAAACATCATTTTATTTCTGGTTGTCTAGGATAGATTCCCAGAATTCTTGGGTTAG 
AGGCCATAGATAATTATGAAAGCAGAAAGATTCACAAGTTGGGAGTTAATACTTGAATTA 
C TTTATTTGGGGTGAAGCATTGAGTG C ATAAT AC AG AT CATGC AG T AATGGG AAG AAGGG 
TTGGAACAATGGTTTTCTGGCCTATGTCAGACTTACCTTGAAGCTTTTAAGAATACAGAT 
GTTCTGATC AAC CCTCAGAC CTATTAAATCAGACCTAAAATCTTAGGGAAT AGGCTTTAG 
GCATCTCTAATTTTAAAAAATTTATTCAGGCTACTTGGATGCACAAAAGAGTTGAGACCT 
ACTGTCCTAGAATCATAGAATTTTAATGACGATAGAGACCTTAAGCATCTAGGTCGTTTC 
TGT ACTTTT AC ATGT AAGG AAACTGG C ATTC CT AGG CC AGT AC C ATTG C C ATG C AG C T AA 
TTTGCCCTCTTGTCTATAGCTCACTCTGCATCACCCAACCTACCGTTCTCACTGTTTCTT 
CTATAACCAATCTCCTTCCCACTTCTGTTCTCTTACTCATGCCATTCTTCCCTCAGTCAT 
TTTTCTTCCTTC C AT AC AAATT C CATGTCTT T AAAAAGG AAT AAT CCTACCTCCTCCACA 
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TAGCTTTCCAATTCTCTGTTGCCCACATTTGTCTCCCTTTCAATACTTCTCTGTTGTGTT 

ATGTGACACATCACATTTGATATACTCTGTACTGTGTTTCAAGTATTGTATTCTCTTGTT 

TACTCAAGTCATTATTTCAGGACTGACTACCCAGTAGATGCTTTAAGTCAGGATTTCTCA 

ACCTTGGCACTGTTGACATTTTGAGCTGGATAATTTTTTGTTTTGGGGGCTCTCCTGTAC 

ATTTTAAGATGTTTAACAGCACCCTTGGCCTCTATCCAGTAGACGCCTGTACTGCCTCCC 

CCTATCTGTGACAACCAAAAAGGTCTTCAGACATTGTCAGATGTCTACTGAAGGACAAAA 

TCACCTCTGGTTGAGAACCACCGCTTCAACTAAGTTATCTTCTCTGTACTCAGAACTTGA 

TG TG ATTG CAG C AGGGGGAG AGG ATT C AT AT AC AC AGTG AAT G C AAAC G AA C CT AAAT C A 

CCATTCGGATATGGCCACACAATTTTCATTTCCCTTGTGTTAGCAAGAGATACCCTAGGC 

TTTGGACCTGATTATTCCTAAGGCATTCTGATGTATGGTTTTACCTGCAGATTTCCTGGT 

AATACTGATACCTCAGTTTGGGTCAAAGAAGGTCAATTAATTGATTGATTTGATTTGACT 

CCTGGAAAAGACGCTCCTTTCTAGCTGTCTCTTTCTTCTCTTTACCTGAATAGCCAGGGC 

TCTGTGGTTCAAGTGAAGTATTTTGACATAAAAATTAACTTAGAACATTGGTCTGCAGAG 

TTTGCTCAATATAACTGAGCACATATTGTGGCTTTATGGAGCTGGTTACTACTTTTTGAC 

C AAAT AAAT AATT AG AAGT AT TTT TC C T C C T C AAT AAGGTT C ATTT TT CCTTTTTTC AGT 

GAGCTGGTAGAGTTTCCTTTTTTGATATTTCAGGGCATCTTTCATATTTCCATCTCTTAA 

GTTTCTTCATATGAAGTAGAATTTATCTGGATTATGTATTGCTGACTCTGATGAAAACCC 

ATAGAAAGCATCTGGGGCTTGATCACCTTCATTCTTGTAATAGCTCACACGGTTACAGCT 

GATATGGTAACTTAAGACTTTTGATTCCAAATCTAGGCAAAATACACTCAGTTGAAAGAA 

TTTGTCAGCCAGAACAGTTGGACTGTTCTGTGAAAATTGTGAGAAAAATTACACAACTAA 

GTGATACATGATGATGGCTTTCTTAAATATAAAATTGTAATAACATGGTTAATTTCCAGT 

ACGTT AT AT TGT C C CAG AAGTGG CT CC AAC ATT GTT TG AAATTT G T CTC AT TT AAAG AAA 

CATAAGCTGGCTATGGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGCTGAGGCAGG 

CAGATCACCTGAGGTCAGGAGTTCGAGACCAGCCTGGCCAACATGGTAAAACCCCATCTC 

T ACTAAAAAT AC AAAAATT AG C CGGGC ATTTGGTGG GGG C C TGT AAT C C C AG C T AC TTGG 

GAGGCTGAGGCAGGAGAATTGCTTGAATCTGGGAGGTGGAGGTTGCAGTGAGCCGAGATT 

GTGCCACTGCCCTCCAGCCTGGGTGACAGAGTGAGTCTCCGTCTCAAGAAAAAAAAAAAA 

AAAAGCAAGAAACATAAAGACTGGGCATGTTGGCTCATGCCTGTAATCCCAGCACTTTGA 

GAGACTG AG GTGGGAAGAT CACTTGAGC C CAGGAGGTT AAG GCTG C AGTG AG C CGT G ATT 

TTGCCACTGT AC T CGAG C CTGGGC AAC AC AG TG AG ATCC TG T CT C AGG AAAAAAAAAATT 

G C ATGT AAATG AATGAATTTG AT ATTT AAT ATTTT AAATT ATG AAAACTGT T C T G TAG AG 

ATGTAGATCTTGCCATGTTGCCCAGGCTGGCTTTGAACTTCTGGGCTCAAACAATCCTCC 

TGTCTCAGTCTCCCAAAGTATAAAGATTACACATGTGAGCCACTGCACCTGGCCTAATAT 

TTTTAACTTAATGAATTTATTTTGATATAAATAAATTAATAACACTGAAGCTTCCTGATA 

TAATAAGTCTTTTTGTGTGTGTGACGGGTTCTCACTCTGTTGCCCAGACTGGAGTGTAAT 

GGCACTATCATGGCTCACTGTAGCCTCAACCTCCCTGACTCAAGTGATCCTCCCACCTCG 

GCTTCCTGAGTAGATGGGACCACAGGCGTATGCCACCACACCTGGCTGATTTTTAAAATT 

TATTATTGATACATATTAATAAAATTATTTTTATTTTAAAAATGATATATGTGGCTGGGC 

ATGGTGGCTCATGCCTGTAATCCCGACAGTTTGGGAGGCCGAGGTGGGAGGATCACTTGA 

GACCAGGAGCTTAAGACCAGCCTAAGCAACATAGTGAGATCCCATCTCTATAGAAAAAAA 

AAATGGCTAGGTGTGGTGGTGTATGCCTATATTCCCAGCTACTCAGGAGACTGAGGTGAG 

AGGATTG CTAGAGC CCAGGAGTTTC AAGTTAC AGTG AC CT ATG ATTG TGC CAGTGC ACT C 

CAGC CTGGGC AACAGAGCAAAATCCTGTCTCAAAAAAAAAAAAAGTTCGAAAATGCTT AT 

G ATGCAATAT AAGT AG TGGAAAAGG ATATTAAATTGTGC CTAT ATG AACAC AACT AT ATG 

AAAAACTTGCACATAGAGAAAAGGATTAACAAGAAATAGACCAAATTGTTCACATGGTTG 

TCTTGTTTGTGGAGAGAATATCAGTAGTTCATTTGTTTCCTTCCAAGTTTATATGTTTTC 

CGAGGTCTCTATAATGAGTTTGTAATTGTTTAATCATAGAAAACCCTTTTTTGGTCCTTG 

GCCACAAACTTACATGTTTTAATGTAATTGCTTTTTTAATGAGAATAAATGTTATATTTT 

GCTTTTTTAAAACCTATATTCCCATAGTTATATGAGCCCTTACAATTATTAAGAGGCTGC 

ATAATATAACGTTTCTGGAAGGGTACAGAAGAAACAGCAGTAATTACCTCTGAGAACAGA 

GACATGGCTTCACATTTTACCCTTTTGTACGTTTTGTGCTTTTGCCACATGCATTTATTA 

TTCTTCCAATAAATAAGTAAATAAATATGGATTGTATACTCCATCTGGTTGGTGTTTCAT 

AATTCTAAAATTATATTGCTACATTTTTAAAGATGATATGTGTTTCTACTTATTAACGTA 
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TATGTTAAAATAGTAAATTTATATCTTATTTAATAATTTCCCTATTGATAGACATTTAAG 

ACAGTCTCAAGTGTTCACTATCATAGAAAATACTGCACAGATAGCTTTTGCTATAGTTTC 

TTTTTTCTTTGAATCGTTAATTGGGAATAAATGCTCAAATAGTTATATGTGGCTCAACTG 

CTATTTAAGTTTATTGACTGACTGCTGCCATTTTGAATTCTGAAGGGGTTGATTAAATTT 

AT AATGC TG C C ATAAG AAT AT AAG GG T ATTG G C TT C ATT AG CAT C C AC CAGCATTGGGTG 

TTGGAAATGATTATAGATTTTTAAATGCTACAACAAATGTAGATAACAGAGAACTATCTA 

TAGAACTCTTTTTGGACATGTGAATTGTAATAATAGTTTATTTTCATGTGAATCCAGAAA 

AATGTATACGAAAACCTTTTTTCCTCTCATTTCTTATATGAATAG AATCAAGCTATAGAA 

GTGGTCTGGAGTCACCAGCCTGCATTCTTGAGCTGGGTGGAAGGCAGGCATTTTAGTGAT 

GGGGGACAGGTAAGCACATGTGATGGCAATAACTTTCTTCTAATATCACATAATATAGCA 

ATAGAAATAAAATTAAAAGTTTAGATTTTTTGTTAAAGGAGGTGAGATGTCACCTAATTT 

GTATGCTATTATGTAACTAGTCTAGGATATTGAAGCTGACTATACTCTGTTTTTAGGTCA 

TTATCTTGTAGTTTACCATACTCCCTACTTGCTTCTTATTCTACTATTTAACTCATTTTC 

C AC ATC C C CT AATTTTGGTTT C ATG AAATTATTTTT C C TT CTG AAT T AC TAG G T T C TACT 

T AC T ATTATT AAACTTT ATTT CTGAC AT ATT TTAT AAC CTT C C ATG G TC T C ACT TG ATT A 

AAAATAAAAAATTCAGCTGGGTGCGGTGGCTCACACCTATAATCCCAGCACTTTGGGAGG 

CCAAGGTGGGCGGATAATTTGAGGTCAGGAGTTGGAGACCAGCCTGCCCAACGTGGTGAA 

ACCCCCCCTCTCTACTAAAAATTCAAAAATTAGCTGGGCATGGTGGCAGGTGCCTGTAAT 

CCCAGCTACTCAGGAGGCTGAGGCAGGAGAATTGCTTGAACCTGGGAGGTGGAGGTTGCA 

GTGAGCTGAGATTGCACTGCTGCACTTCAGCTGGGTGACAAGAGCGAAACAATGTCTTGA 

AAAAAAATAAAAAATAAAAAATTCTACAACACAGGGTTATTATTTTTCCATTTTTGTTTT 

CCCTTATGAGTTTAATATGTTTAGATTATAAACCTGAAAGCTTGAATACCTATGTCTATC 

TTTTGTTTTCTTATGTTTATCAAGTTATTCCTTTAAACATTTTCTAAACTGTAAGAATAA 

TGTGAGGCTGGGCTCAATGGCTTATGCCTGTAATCCCAGTGCTTTGGGAGGCCAAGGTGG 

GAGGACCACTTGAGGCCACGAGTTCAAGATTAGCCTGGCTAGGCAACATAGCAAGACCCT 

ATCTCTATAAAAAAATTAAAAAAATTAGCTGGGCATGGTAGCAAATGCTTGTAGTCCCAG 

CTACTCAGCAGACTGAGGTAGGAGGAATGCTTGAGACCAGGAATTTGAGTGACCTATGAT 

TATGCACTCCAGCCCGGGCAATAGCAAGACCCTATCTCTTAAAAGAAGAAGATGTAGTAA 

TAATACATATTCATTATAACTATTTTACCATTGAAAGTAAAAAATGAGTTTTTACCTTTT 

CCCAGTCCCATCCTCAGAATGGGGATCTCAGTAGACCTTTAGGATTGGAAGAATGAGATC 

ATTCATATTTTCTGCAATTATTACCCCACAAAATATTTCAGATACCTTTCCATGTATTAC 

AAACAATGTGCATTTAACATGTCTCTCTCTTTCTCTCTCTCTCTGTGTGCGTCTTCATGA 

TCCTCTGTTGCAGCCCTGCCAGTAAGACACTATCTCCTGAAGAATCACTGATAGGAACAG 

AAAGTGGACTGGCTAGGCCAGGAGTCCTTAGCTTCTTAGGGGGCAGGAGCTGCTTTGTGC 

TTTCTCAGAATCAGATATATATGTGGACTGAAACATTTAAAAACAGAATAGCCAAGGGTG 

CTATACGTTTAAAACTTATATAGATGGGGCTACATTGCTCTCTATTACTAATTTCCCATG 

ACAATACACGAGAGTGCCATGTCTTTTTAACTTGTTTTGAGCACAGACTAATCTTGTTTA 

TGCATGTTTTTTGATGAGAATAGGCTACTCATGAGAAATCTGTAAACCTAACACTAGTCC 

CTTGCATACTCTAAATTGTTGCTAGAATCTTAAAATTTTAGCACCAGACGGACCTTAGAA 

ATCATTAACTTTGGTGCTTTGTTCTACAATACAAGGAGATGGAATATTTTACCCAGGATT 

GCTTAGCAGGTTACAGTTCTGCCCTCTGAGTACCCAGCACTTCCCTGTGGGCAACATCAA 

CTTCCTGATTTTCAAGTCTTAATTAGTACTCTGAAGAATCCTACTTGTTTTTAACTCCCA 

TTTGCTTTGAAGTGACTTTACCTGATTTTTTTAGATCCCTTATTGCAGCAATGCCACTAA 

GAAACTGAGTCTCTAGCTTCTTGGTGGGCAGGAGCTGCTTTGTGCTTGCTCAGAATCATC 

CTTTTCAGTAAGGGAGATATTGAAGAGAAATCTACTGAGGAGTCTGGGGGTGAGGCACTC 

AGGGAAATC CTG CTC C AGTC CACAAAAGC AG AG AGG AAGGGTTGGTTAC CT AG AG T ATTT 

AACATGCAGAGGCTTTGGATTTTACTCCTTTAATCCTTGGAAATGCCTATGGAAGGGGAA 

AGGAAGTAAGATGGTGACTCCAGCTTATAGACATACTAGTGTTACATATATTTAAACTAT 

AATAGGAGGGTATTATTAGTTTTACTTAACTTTCAACTGTGAAGGATTATACTTCTCAAT 

ATTTGTCTCCAGTGTCTATTTCAGTGTATTTTTCACTTTTCTTGAAGCAGCATGTCTGTT 

GCAAAACTTCTAGAAATAATGAGAATATTTATATATTAGATCAAGCCATAACTTGATGAT 

ATAGTCATTTCTTCTTATATTTTTTACTTACATTTTTACATTTTAATGATTACTTTCATT 

TTTGAAAAACATGTCATGCTGAGATGTATTTTTCTTCATTCTGTAATTAGTTATGAAACA 
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GTTTTTCCTAAAATGCTGAGTATATCAAGTCTTGGCTAAGAATAAGTAATAAATATTTGC 
CACATGAAAGACTACACATATAGCCAGGTGCAGTGGCTTGCACCTGTTTTCCCAGCTACC 
CAGGAGGCTGAGGCAGGAGGATTGCTTGAGCCCAGGGTTTCCAGGCTGCAGTGAACTATG 
ATTGTACCACTCTACTCCAGAATGGGTGACAGAGCCAGGCCCCATCTCTCAAAACAGAAA 
AGAAAGATTACATAGACTACATATACACCCCCATCCAAAACATACACACACATCTACTTA 
ACCTAAAATGGTAAGAAGATAACTTCTTATTTTCTAATATATGACACAGAAAAGTTTTTT 
TAAAGTAGTTTTAAATTTTTAATTTTTTCTAG GTATTTCTCAAGCCATGTTCCCATGTGG 
TATCTTGTCAACAAGTTGAGGTGGAACCCCTCTCAGCAGATGATTGGGAGATACTG GTAA 
AGAAAACCAAATAAGAACTATCTCATTTAAGGTTAAATTACTTCACAATATCAATGTCTT 
TAGCTTTCTCTAAGCTTTATTATATATTCTGAGTTGGTTTTGAATTATAAGAATGAATTG 
GGGCCAGGCACAGTAGCTCATGCCTATAGTCCCAGCACTTTGGGAGGCCAAGGCAGGTGG 
ATTGCTTGAGTCCAGGAGTTCAAGACCAGGCTGGGCAACATGGTGAAACCCCGTATCTAC 
TAAAAATACAAAAATTAGCCAGGCATGGTAGTGCATGCCATTAGTCCCAGTCACTTGGGA 
GGCTGAGGCAGGAGAATCGCTTGAGCCCGTAAAGTCAAGGCTGCAGTGAGTCAGGATCTT 
GCCATTGTACTCCAGTCTGGAAAACAGAGTGAGACCTTGTCTCAAATAAAAAAAGAATGA 
ATTGATAGAGATCTAATGTACAACCTGACAACTATAGGTAATAAAATTGTATTGGGGATT 
CATGTTAAATGAGTAGATTTTAACTACTCTTACCACAAAAACACAAAAGTGGGTAACTGT 
GAGATGATGTATATGTTAATTTACTTCACTATAGTAACCATTATACTATCTATATGTAGC 
TCATAACACCATGTCGTGTATATTAAATATGCACATTAAAATTTGTTTTTTAAAAAAAGA 
ATTGAGATTTTTTTTAACTAGATATGGAGTGGACAAAATGTAAAGTGAATTGATCTTTTC 
GTCTGTTGGTTCTAG GAGCTGCATGCTGTTTCCCTTGAACAACATCTTCTAGATCAAATT 
CGAATAGTTTTTCCAAAAGCCATTTTTCCTGTTTGGGTTGATCAACAAACGTACATATTT 
ATCCAAATTG GTAGGTGCTATTGTAATATTTGCTGTCATATTCTACACTATAGCATTGAG 
TCCAAAGTAGAAATGAATGTGCACTAATGAGCTTTATTTTCTACACAG TTGCACTAATAC 
CAGCTGCCTCTTATGGAAGGCTGGAAACTGACACCAAACTCCTTATTCAGCCAAAGACAC 
GCCGAGCCAAAGAGAATACATTTTCAAAAGCTGATGCTGAATATAAAAAACTTCATAGTT 
ATGGAAGAGACCAGAAAGGAATGATGAAAGAACTTCAAACCAAGCAACTTCAGTCAAATA 
CTGTGGGAATCACTGAATCTAATGAAAACGAGTCAGAGATTCCAGTTGACTCATCATCAG 
TAGCAAGTTTATGGACTATGATAGGAAGCATTTTTTCCTTTCAATCTGAGAAGAAACAAG 
AGACATCTTGGGGTTTAACTGAAATCAATGCATTCAAAAATATGCAGTCAAAGGTTGTTC 
CTCTAGACAATATTTTCAGAGTATGCAAATCTCAACCTCCTAGTATATATAACGCGTCAG 
C AAC CTCTGTTTTTC AT AAAC ACTGT G CC AT TC ATGT ATTTC C ATG GG AC C AGGAAT ATT 
TTG ATGT AG AGC C C AGCTTT ACTGTG AC AT ATGG AAAG CT AGTT AAG CT AC TTT CT C C AA 
AGC AAC AGCAAAGT AAAACAAAAC AAAATGT GTT AT C AC C T G AAAAAG AG AAGC AG ATGT 
CAGAGCCACTAGATCAAAAAAAAATTAGGTCAGATCATAATGAAGAAGATGAGAAGGCCT 
GTGTGCTACAAGTAGTCTGGAATGGACTTGAAGAATTGAACAATGCCATCAAATATACCA 
AAAATGTAGAAGTTCTCCATCTTGGGAAA GTCTGGGTTAGTATAAATTTTATAACTTGGG 
AGAAATTTTATGTGGCTTAAACATCCCCAAATTATGAATTAGAATAGTATTTCATATATA 
AATTGAAAATCAATTAAAAAGAAACACAGTG C CTAAAGGC ACTTGGGGG AC AC AT TTACG 
CTTTGCAGTAAAGTCCTTGTTTGGATAAAGATTGTATGTTTTCTGGCCAAGTAAGCTTGA 
ATAGGTACAAGCTTAGATAGGTTCAGGCCAGAGAGGTCAAAATTACTTGCCTGAGATTGC 
ATAGCTAGTGTT AC AACT AG GATTCAAACCCAGG C AGATTGACTTGGGG GTTC ATC AGGA 
TGG AGTG C CCT ACAAAG C CTCC CATCTTTAATGCTT G CAG ATTTGTT C C C C AGTT ACCGA 
AAG C AAC TTGTTAATATTAGGGAAAAGGGC C AGTGTAGGG AGAG ATC CATGGCATG AGGT 
AACCTTCCTGCTGCATGTGGTGGCACCTGGATTGGAATGCATCCAGGAGCTGCTTACCCT 
GCCGGTGTCTGCTCTTTAATTTGTGTATAACGGAGAGGAAGTAGACAGGGCAACTAGTGC 
TCCAGCCCCTCATCCTGGCCACAAATATTAATGCTACCTTTATATGACATAAGTCACTAG 
TCCATTTATTGGAACCTAAATTTGAACCACTGTAAAGTAAGACTTCATAGTGATAAAGAG 
AGGAACTTGTTAGGAAAGAGAATAAAATAGAAAGAGAAGGTTGTCTCCTTTTGTAGATTT 
TTTTTTTTTCTCCAACAGTTTTACCTGTGACCTTTATACAAATAACTGACAAAGCATTAA 
TCTCTTTGGCCTACATCATTTTCTTTTCTATTTTTTTTTTCCAC AAG ATGG AGTTTCACT 
CTTCTTGCCCAAGCTGGAGTGCAGTGGCATGATCTGGCTCACTGCAACCTCCGCCTCCCA 
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CGTTCAAGTGGTTCTCCTGCCTCAGCCTCCTGAGTAGCTGGGACTACAGGCATGCACCAC 
CACGCCTGGCTAATTTTTTGTATTTTTAGTAGAAACTGGGTTTCACCATGTTAGCCAGCC 
TGGTCTGGAACTCCTGACCTCAGGTGATCTGCCTGCCTCGGCCTCCCAAAGTGCTGGGAT 
TACAGGCATGAGCCACTGCTCCTGGCCGGCCTACATCATTTTCTAAAGCTCCAGACCATT 
CTTTTCTTTTCTTTTCTTTTCTTTTCTTTTCTTTTCTTTTCTTTTCTTTTCTTTTTTCTC 
TTCTCTTCTCTTCTCTTCTCTTCTCTTCTCTTCTCTTCTCTTTTCTTTTCTTTTTTTGAG 
TTAGAAGCTTGCTTTGTTGCCCAGGCTGGAGTGCAGTGGCACCACCTCCACTCACTACAA 
CCTCCACCTCCCAGGTTCAAATGATTCTCCTGCCTCAGCCTTCAGAGTAGCTGGGACTAC 
AAGTGTGCGCCACCACTCCTGGCTAATTTTTGTATTTTTAGTAGGGACGAGGTTTCACCA 
TGTTGGCCAGGCTAGTCTTGAACTCCTGGTCTCAAGTGATCCGCCTGCCTCAGTCTCCCA 
AGGTGCTGGGATTACAGGCGTGAGCCACTGTGCCTGGCCTCAGATCATTATTTTCTGTTA 
GCTTTAAACTGTCCGTTCAGGAGATCCCACTGCATCCTCAAATTCAAAATATCTAACACT 
GAGCTTATGATTTAGCTGGTTCTGTCATTAGATGGGAATATCCTTTTATTTCCTTGAAAT 
T AT AT GGTG AG AAC AGGG AG AAGTGC TGATGGT AAAGT C C TG TG AT T AAG AT AG C AATAA 
GGACTCCGCCCTTCCCACTCCACTGAAGGTTGAAGAGCCATGGACAATGAGAAGTCACAG 
TAGGTGAAATCAGGTACTAAAATGGACTTGGCTTGAGAGATCAAAATTGATCACTTGGTG 
AT AC AAC T AAC AAAT TC ATGTT AAC TTGAAC CTTT ATT AC C CTG TG AAG C ATGGTG AT TA 
AAAAAAAACAACAAACAAACAGGAAACTTGATTGTTAAATTCTCTTTAAGTCAGAATATG 
T AC CTTAG AGTT TTTATTT ATGCTTTTGTCT AC C ATT AAT ATGTCT GC AC C TG C T C TTT A 
G AAGTT AAT AGAGAG T AAAG T CGTCTTT ATGT CTTT C AGTGCTT AC TT AT A TTTGG G AAG 
TTGAGAAAAATTTTTAACATCATTATTGATATATATATATATATATATATATATATATAT 
ATATATATATATATATATATATAGATAATTTTTTTTTTTTTCTTGAGACGGAGTCTCACT 
CTGTCGCCCAGGCCGGAGTGTGGTGGCGATCTCCACTCAATGCAAGCTCTGCCTCCCAGG 
TTCAAGCGATTCTCTTGCCTCAGCCTCCCGAGTAGCTAGGATACAGGCTCCCACCACCAC 
GC CTGGCT AATTTTTGTAGTTTT AGT AG AG AC G AGGTTT C AC C ATATTGGC C AC G C TGGT 
CTCAAACTCCTGACCTTGTGATCCGCCCACCTCGGCCTCCCAAAGTGCTGGGATTACAGG 
CGTGAGCCACTGCGCCCGGCTGAGGTAAAATTTAAAGTGTACAATTCAGTCATTTTTAGT 
ATATTTATACTAGTTGTACAGCCATCACCACAATCTAAGTTTAGAACATTTTCATTAGGG 
GGTGGGAGAAATTTTACTCTGCTTTTTAGATTAAGTTTCTGTCTGGATCTAATCATTTAA 
TCAGACAATCAGGCAGATTGTCTGTGATTAGTTTTGGCCATTCCAGCTTCTTCATTGGTT 
GTTAACTTTCACAAATAAAGGCTGCTCAAAGATTAGAAATAACATTTAATTTGAATGTAA 
ATGTGCCATAGTTTAAAAGATGGGTTTGGTGAATACAGTCAAATACATACATTTAAAGCT 
CTAATTC TG AAG ATT ATGT AAAG AAAAGG AAAG AAATGT AGGG AGAGG ATT GAAAT GTT C 
ATGGTATAACAATATCTGAACATCCATCTGGTCACACCGTTGGTATTTGAATGTTTTGTC 
CT C CT C AAATTC AT AT GTC GAAAT CCCAACTCCCAAGGTGATCGT ATT AGGAGGTG TGGT 
CTTTGGGAAGTGATTAGGTCATGAAGGTGAAGCCTTCATGAATGGGATTCGTGCTCTTAT 
AAAAGAGAACTGTGAGAAATAAGTTTCTGTCGTTTGTTAGCCACCCAGTTTAGGATATTT 
TGAT ATAG C AG C CTG CATGG ACTGAGAC AACTATGAGTT ATT ATG AT AGCTTCTG TT ATT 
TCAC C TAAATT C ATAG AAGCTAAT ATATC AAT ATTT ATG CTATG AAATATTTCTT AACCA 
AGCTTTG AATATATTTAT ATTTTTGTTTATTTTTAAATTTCAG ATT CC AGATG AC CTG AG 
GAAG AG ACTAAAT AT AGAAATG CATG CCGTAGTC AGGAT AACTC C AG TGGAAGTT AC C C C 
T AAAATT C C AAGATCTCT AAAGTTAC AACCTAGAG AGAATTT A GTG AGTTC AAAT AT AT A 
TGTTACATCAAAATTCTTTTACACGT TTTGTAAG ATTTCT AGTT GCTTTAGCT AAG T AAT 
AAGAATGTTGTATTCCTTTTTGATACAAATCTTTTTTTATTGTGTTAAACTATATATAAC 
ATAAAATATGCCATGTTCGCCATTTTTAAGTGTATAATTCAAAGGCATTAATTACATTCA 
T AAT ATTGT ACAAC C ATCACC ACT AT CTAT AT CCAG AACTTTT C CAT CACC CC AAAG AG A 
AACTTGGTACCCATTAAACAATAATTCCCCGTCCACTCCTTTCCCCAGTCCCTGGTAATC 
TCTAATGTAT AT TGTGT CTCT ATGAATTT ACTT ATT CT AG AT ATTTC AT AT AT AAGT AG A 
AGTATGCATTTGTCTTATGTATCTGACTTATTTCATTTAACATAATGTTTTCAAGGCTCA 
TCTGTGTTGTATGTATCAGAATGTTATTCCTTTTCATGGCTGAATACTATTCCATTGACT 
GCATATACCACATTTGTTTATCCATTCATCTGTTGATGGACACTTGGGTTGTTTCCACAT 
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TTTTGGCTGCTGTGAATAATGCTACAGTGAACATTGGTGTACAAGTATCTGTTTGAGTTC 
CTCTTTTCAGCTCCTTTGGGATATACCTAGGAATTATGTTTAACTTTTTGAGAAGCTGAG 
AAAT CTTT AAT AAATG AT AA C AC AAATACTT AT ATTTG C C AATG C AAAT AT G AAT ATTT T 
TGGCTTTTAAGAGATTGATCATTTTGCCACGTGGTTGTAATTAAAAAAAATTGTCCCATG 
TTGTTTCAGTATTAATATTGTAGCCTAAAAGAGTGCTAGACTGTTTTACTTTTTACTCAG 
TT AATT C TTTGG AT ACT GGT AG AG T C AGG AAATG AG AT ATT G AAC T T AAAG AT CTT T G C A 
GGTGGGGTCCAGTGGCTCACACCTGTAATCCTAGCACTTTGGGAAGCTGAGGTGGGAGGA 
TTGCTTGAGGCCAAGAGTTTGAGAATAGCCTGGGCAACATAGCAAGACCCCATCTCTACA 
AAAAAATTAAAAAAAAAATTAAGCCAGGCGTGGTAGCTCACGCCTGTTATCCCAACACTT 
CGGGAGGCTGAGATGGGTGGATCACTTGAGGTCAGGAGTTGGAGACCAGCCTGGCCAACA 
TGGTGAAACCCCATCTCTACTAAAAATACCAAAATTATCGGGGCGTGGTGCTAATCCTGT 
AATCTCAGCTACTCAGGAGGCTGAGGCAGGAGAACCACTTGAACTGAGGAGGTGGAAGTT 
GCAGTGAGCCTAGATCTCACCACTGCACTCCAGCCTGGGTAACAGAGCGAGACTCTATTT 
CAAAAAAAGTAAAAATAAAAATTAGACACATGTGGTGGCACATGCCTGTAGTCCTAGCTA 
CTCAGGAGGCTGACTGAAGTGGGAGGATCTCTTGAGCCCAGGAGTTCCACACTGCAGTGA 
GCTATGATTGTGCCACTGCACTCCAGCCTAGGCAATATCTCAAAAAAAATTTTTTTAAAT 
AGATTATTAGGCCAGACGTGGTGGCTCATGCCAGTAATCCCAGCACTTTGGAAGGCCAAG 
GCAGGCGGATCACCTGAGGCCAGGAGTTTGAGACCAGCCTGGCCAACATGGTGAAACCCC 
ATGTCTACCAAAAATACAAAAATTAGCTGCAATGTCTATAATCCCAGCTACTTGGGAGCC 
TGAGGCAAGCGAATCGCTTGAACCCGGGAGGCAGAGGTTGCAGTGAGTGGAGACTGCGCC 
ACTGC ACTC C AGCCTGGG CG AT AC AG CG AG ATT CTGT CT C AAAG AAAAAG G AATTTGTTT 
TCCTGTCTTTATCGTAGAGGGAGGAAAGGGAGAATGGGGTTGGAATGGTTATTGAGTGAG 
CCACATTATGGTAGATGTATCACTGGGCATAGAGAAAAGGAGCATTTAAAACTTTTCCGC 
CTAACAGATGTTTCTTCAGGCTACACTGCACTCATTGTGCTAACTGTAATGTCAAATCCC 
AGACCTGTGCCTATAGAACATGAACATCCTTCATTGGATTTGTTTGGTCAGGCTTACACT 
TTATTAGGAAGATCAGATGTTAAAATAAGGGTGTTAAAGTTAAGTTCAGATATGAGGATA 
ATTCATTACTATTCCTTTTTCTGGCAG CCTAAAGACATAAGTGAAGAAGACATAAAAACT 
GTATTTTATTCATGGCTACAGCAGTCTACTACCACCATGCTTCCTTTGGTAATATCAGAG 
GAAGAATTTATTAAGCTGGAAACTAAAGATG GTGAGTACATTTGTTATTTTGACTTTTTT 
TTCTATTTAAATAGTTGTACATTTTTAATTGTTCTTGCAACCTGTCATACCTGTGAACAG 
TATGTGAATAGTGAAATATAATTATGATAATTAAACAGTAGTTTTTATGTATTGAAAAAT 
ATCTTTGGCCGGGTGCAGTGGCTCATGCCTGTAATCCCAGCACTTTGGGAGGCCGAGGCA 
GGCGGATCACTTGAGGCCAGGAGTTCGAGAGCAGCCTGCCAACATGGCGCAACCCTATCT 
ATACAAAAAAATACAAAAATTAGCCTGACATAGTGGTGTATGCCTGTAGTCCCAGCTACT 
TGGGAGGCTGAGGCAGAAGGATCACTTGAGCCCAGGAGGTCTGTGTTCCTGCCACTGCAC 
TCCAGCCTGGGCAGCAGAGTGAGACCCTGTTGGGGGGAAAAAAAAAAAAGTCTTTAACTT 
AAATAAATTTGACATTTAAAATCTTAAATTATTTCATCTCTGTTTCAGTACTAACTCTGC 
ATTTATT ACTTT CT1TTTAATAG GACTG AAGGAATTTT CTCTG AGT AT AGT T CATTC TTG 
GGAAAAAGAAAAAGATAAAAATATTTTTCTGTTGAGTCCCAATTTGCTGCAGAAGACTAC 
AATACAA GTAATAGCATGTTATTGAATATTTAATAAAATACTATTTGTTACATATGATTG 
ATAATAAAGTATGAAGTTCCTTGTAACACCTTGCATTGTGAAGTGTATTAAAAACCTGCT 
AAGAGTAAGGAATAACTTGATTTAAAATATTTTATTCTGTAATCTCTTTAAATTATCTGT 
ACAAATT ATTGACTTAAC CTAAATTT AAAAATGAATGCCTT AGCAC AATTAAGTTC C AAG 
AAT AGAGTTG ATC ATGTT AAC TGGTAAATGG ATCATGATTT AAAATT CTTCTAGGATTG A 
AACAAATGAAAACGTAGTTTTAAGGGTTTGATTTTTTAAATTCCTATTTTTACATGCAAT 
TTTACTGCACAACCCATCTTATTTTGACAGTTCTTAAATTCGCAACTCTTCAGAAATATT 
ATCAGATCACTTTTCTTTGCTTCCATAAGTTTTTTTATTATTATATTATTATTTTTTTTT 
TTTAAAAGACGGTGTCTCACTTTGTCGCCCAGGCTGGAGTGCAGTGGCATGATCATGGCT 
CACTGCAGCCTCGACCTCCCAGGCTCAGGTGATTCTCCCACCTCAGCCTCCCAAGTAGCT 
GGGACCACAGGCGAATGCCATGATGCCTGGCTAATTTTTGTATGTTTTGTAGAGATAGGG 
TTTCACCATGTTGCCCAGAATTGTCTTGAACTCCTGGGTTCAAGCAGTTGTTCTGCCTTG 
CCCACCCAAAGTTGTGGGATTACAAGTGTGAGCCACTGCGCCCAGCTATTCTAGAAGTAT 
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TTTAAGAGTCATCTTTTTTTTTTTTTTGAGATGGAGTCTCACTCTGTCACCCAGGCTGGA 
GTGCAGTGGCACACTCTCGGCTCACTGCAACCTCCACCTCCTGGGTTCAAGTGATTCTCC 
TGCCTCAGCTTCCCTAGTAGCTAGGATTACAGGCGCATGCCACCATGCCCTGCTATTTTT 
TGTAGTTTTAGTAGAGACGAGATTTCACCATGTTGGCCAGGCTGCTCTTGAACTCCTGAC 
CTCAAGTGATCTGCCCTCCTCAGCCTCCCAAAGTGCTGGGATTCTAAGTGTAAACCACCA 
C AC C C AG C C AAG AGTGG T CTTTTTAC AAT ATT ATTTTTTG ATT AGG AC ATT C ATT C TTG T 
CATAAAATTGAAGATACTCTAGTCATTTAGAATTTCATTGTTTTGGAACTAGACATTGTT 
TCTTTATTTTTGAAATGTTATTGAAGGAATACCATTTGGAGAAGATACAAATGTAAGAAT 
TGTGAAAAGGATAATTGTGACACAAATCAAAATTATAGATAAAAATATACCTGTAAAATG 
TATTAAGGCAATAACATTCTTTCTGCTTGTTGACCATAAATATTTATATTCCCTGGATGG 
GTACATTGTTATTGTCAAGGGTGTTTAAATAATGATCTTGCATGCATAATTTATTCTCTC 
TGGTATAACAGAATCAGCAATTTAGTTTTCTGGGACCCGAGAAAAACATGCAAAAGACAT 
ACTTTGAAATGTAAAACTGATTTTTCCTTGCAACTGTAG GTCCTTCTAGATCCTATGGTA 
AAAGAAGAAAACAGTGAGGAAATTGACTTTATTCTTCCTTTTTTAAAGCTGAGCTCTTTG 
GGGTAAGAAGTTATGGCCAAACTAGCATGTTAGACATGTTTTTAACACTATATCTGGCAG 
AGTTTTCAATGTAAATATTAAAGTAGATGTTAATGTCAATAAGTGATCTTAATAATGCAT 
CAGTAGATATTTTTTCAAGGATTGTCTCTATCTTCACGCCTAGCTTATAATTTGCCTTGT 
CGTCTTTTTTTTTTTCTCTTTATTTTTATGTTTTTATCCATCCCTGGTGGTAGGGGATAA 
CCTTGTCTTCTTCGATAACAAGAAGTCTGAAGCTTATTAGAAATTTTACTTTGAGAATTG 
ATCGATGAGAAGAAAGCAACTAGATATCACGTGGATCATATATGCTTGAATAAAACAATA 
ATTCTTAGAAGAAATAAATACATTTTAAAAGTTAAAGCCAAAAACATTAGTTGAATGTTT 
AAAAATATTTCAAATTAAGTTATTCCTTCACTGTCTTGTATTACTGTAATAATTTGGATT 
ATTTGTGTTTTTCTCAACTTTTAAAACAAATATTTAAAAAATTCCTCTTTTGATTAAGTA 
GGGCTAGATAAAATATAAAAAATATTTTTTAAACTCCTCTTAATTTCCATATTTCTTATA 
T AATATG AG AATCT CTT ATAAACACT AC CTCTTAGAAG TCT C C ACAGAAG CTTTGGT AG A 
TGTAGTAGTAGGGATTTGATTTCTTAGAATGGTATAATCTGTAAATGTTTTAGTAAAAGG 
ATTAAACG ATAAAGTCAAAATGTTT ATAGC AC AGTG TT T ATTAATATAAAATAAAAT CT C 
TTTTTTTTTTTTTGAGATGGACTCTCACTTTGTCACTCAGGCTGGAGTGCAGTGTTGCAA 
TCTCAGCTCATTGCAACCTCCGCCTCCTGGGTTCAAGCAATCCTTCCGCATCAGCCTCCT 
AAGTAGCTGGGATTACAAGCATGCACCACCACACCTGCCTAATTTTTTGTATTTTTAGTA 
GAGATGGGGTTTCACCATGTTGGCCAGGCTGGTCTCAAGTGATCCGCCTGCCTCAGCCTC 
CCAAAGTGCTGGGATTACAGGCGTGAACCACTGTGCCCAGCATAAAGTAAAATCTCTTCA 
GACTCTCATGTGATCATGTAAAGTGGCAGGCAGTCACAGTCAAGAAGTAGTTTAAAGTTC 
ATGTTTGTAAAATATAATCTACAGATTGATACTGGATTTCATAGGTAATGTTTAAGAGAA 
AATAAGTTTTTAGTTATCCTCAGTACTTCAAAAGCACCCATTTATGATTATGTTGATTAC 
TAAACTAAATCATTTGGGGGCTAGAGGTGTTTTTTTATGTGTTAAGATTCCTTAAGGAGT 
TCTATTAGGGCAAAACTTTTAGTAACTGCATATTTTAAAAGTAATAAAACTAATTTTAAA 
AGCTTGGAGGCTGGGCGCGGTGGCTCACACCTGTAATTCCAGCACTTTGGGAGGCCAAGG 
CGGGTGGATCACTTGAGGTCAGGAGTTTGAGACGAGCCTGAGCAACATGGTGAAACCTTG 
TCTCTACTAAAAATACAGAAATTAGCCAGGTGTGGTGGTGGGCACCTGTAATCCCAGCTA 
CTCGGGAGGCTAAGGCAGGAGAATTGCTCGAACTTGGGAGGCAGAGGTTGCAGTGAGCCG 
AGATCATGCCACTGCACTCCAGCCTGGGTGACAGAGCAAGACTCCGTCTCAAAAAAAAAA 
AAAAAAAAAAGCTTGAAGT CAG ATT CGACATTAATCAGT ATACTTT C TCTCAAGTAGGGG 
ACAATTTCTAAGATTTTAGTCTTTTAAAATTTATTAACTAGTCTGAGCATGGTGGCTTGT 
GTCTATAATCCCAGCACTTTGTGGGGCCGAGGCAGATGGATCACTTGAGCCCAGGAGTTG 
GAGACTAGCCTGGGCAACATGGCAAAACCCCGTCTCTACAACAAATGCACACACAAAAAA 
CCCAATCAGCTGGGTGTGGTGTTACACTCCTGAAGTCCCAGCTACTCGGGAGGCTGAGGC 
AGGAGGATCACCTTTGCCAGGGCGTTTGAGGCTGCAGGGAGCTGGGTTCACACCACTGCG 
CTCCAGCCTGGATGACACAGCAAGCCCCTTTCTCAAAAAAAAAAAGATAAAAAATTAAAT 
TAAATTAATTAACTACACTGGGAAGGCAAAATTCAGCATTTTTTTATAGCTAAATTTTAT 
CCTGCTTCAGTCTTTTATCATGTAACTATGTATATTTTTTACAG AGGAGTGAATTCCTTA 
GGCGTATCCTCCTTGGAGCACATCACTCACAGCCTCCTGGGACGCCCTTTGTCTCGGCAG 
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CTGATGTCTCTTGTTGCAGGACTTAGGAATGGAGCTCTTTTACTCACAGGAGGAAAGGTA 
AGTG GTTAAGGTGTGTTCATTTTTCTGTAACATTTAATAACTTTTCATTTATCTTTCTTT 
GGGTTTTG AC C AT CT ATT AT AT AGGG TGG G TTTTG AC C ATCT ATT AT AT AGG G TTT AT AC 
GACATATGGAAAGCATTCATTTATTCACTAATATTTCTGTGTGTCTGCTTTTAGGTGTTG 
GGGGAGTGATGACGAATAAGACTGATGTTCTCCATGCCCTTTTTCTGTGTCAGTTGATAC 
AATTATATGGTTTTTCTTTTTTAGGCTATTAGGTGTTGATAGGGTTGAGTAACTTACAAA 
TGTTGAACCAGCCTTGCATACCTGTGATAAATACCACGTAGTTGTGGTGTATCATTCTTT 
CTACATTGCTGAGTTTTATCTGCTAATGTTCTGTTGAGCTTTTGTCCATTTAAGTTTGAA 
AGTGATTAGTTTGCAGTTTTCTGTTTTTGTGTTGTCTTTGTCTGGTTTTGCTATCCGTGT 
AAATCTGGCCTCATAAAATGAGATGGGAAGTATTCTCTCCTCTTCTTTTGTTTTTTTGGA 
AGAGGTTGTATAAAATTGAGGCTGAATCTTGGTGGTTGCCACAATGACAGGAACTATTTC 
TOTGACTGAATATATTGGGAATTC CTATAAAGCAAT TATTTT CT AG GG AAG TGG AAAATC 
AACTTTAGCCAAAGCAATCTGTAAAGAAGCATTTGACAAACTGGATGCCCATGTGGAGAG 
AGTTGACTGTAAAGCTTTACGAGG TATGAGTATGGTAACACTCTATATAAATCCCTTTTT 
CATTAGAAAGACAGGAATGTTATACATAATGCTGTCAATCTAATAAATACACATATCATC 
TAGTCTTTAACTTTTCTGTTTATCATTTAGTCATTAAAATTTCTTTGGCTTTCTAATGTT 
TTTGATAAAATTTCTAAAACTCTCCATATTTAATGGAGGCCTATTTTTTTTTCTAGCCAG 
AACTTTTTGTAGACTACATTTCTGGAAGTGCTCACTGACACCACTCTGAAAAATTAGTAC 
TTAGAATATACTCTAATTGGTATAAATGATCTCTGAATTGCTATGGAAAACTGGGAGAAT 
GGTTGCTTCAGGGGAGAGAAAGTAGGAGGCTGTGGACAGCAATGAGGAGAATTACAGTTC 
ACCATATAACACTTTTGTACTTTTAAAGTCCTTAACATTTACATTATTATCTATTCAATT 
AAAAAATATTGGGAAGATTTTACTTTGAACAGTTAATTTTTCCCCCATGGGTACCGCTGT 
CATATAGTTCCAACTAATCATGAACTTGTGTATTTCCTGTTCTTTGTAAATTTAAACTTT 
GTAACTCACCAGGAAGTTTGAAGCCAAATTTGTGTTTCAAATATAGCAACTCCAGGATCT 
CTAGGC^GATGCATTTGCATTTGATTTTAAATGAATCTTGATCCCTTACTCTCACTTATG 
TTTTCCCACATCCTACTTTTTTTATTTTGTTGTAAGCCATCTAAAATTCTCAATGGGATG 
AAACTGGGT ATAAAT GAATAC ATGCAT ACAGGAATT ATAGT AGC ATATTCCTTTT C TTTT 
TTCTTTTTTTTTTTTTTTGAGACAGAGTCTTGCTCTGTAGCCCAGGCTGGAGTGCAGTGG 
TGCGATCTCGGCTCACTATAGCCTCCACCTCCCAGGTTCAAGCAATTCTCGTGCCTCAAC 
CTCCCGAGTAATTGGGACTACAGGTGCATGCCACCACACCTGGCTAATTTTTGTATTTTT 
TAGTAGAGATGGGGTTTCACCATGTTGGCCAGGCTGATCTCAAACTCCTGACCTCAAAGT 
GATCTGCCTGCCTTGGTTTCCCAAAGTGCTGGGATTACTAGCATAAGCCACTGCACCTGG 
CCTCCTTTTCTGAGTTTTATAAAATTTGATACTTTACTGCACGCTTTGAGACTGTATTAA 
TTGAACCATGTTGATGAACAAGTTTTTGTGATGGGTATATTAATAAAATATAGATCAAAT 
TTTTATAGTTAAATCAATATCGAGCTTTTCTAGTGCTTTCAAAAGGACAACCTGAATTTT 
rrCAGCACTGAAATGATACTGAAACCATTTCATATCTTCTGTATTAA GGAAAAAGGCTTG 
AAAACATACAAAAAACCCTAGAGGTGGCTTTCTCAGAGGCAGTGTGGATGCAGCCATCTG 
TTGTCCTGCTGGATGACCTTGACCTCATTGCTGGACTGCCTGCTGTCCCGGAACATGAGC 
ACAGTCCTGATGCGGTGCAGAGCCAGCGGCTTGCTCATG GTAAATGCATCCACCACTGGC 
TTAAGGTCTTGTTCTTTTGTCAGTCAGCATTTTTAGTCTTAACAATAAATCTACTCTCTT 
CAGAGAATAATATATGTGTTATGTTAAGTGTTGTGTTTGAGGCCCCTGATGGCATTCTAC 
AGTTGTCCTATAGACTGTAATAGCAAAATTGGTAGAGTAAAAACAGTGTGAAAATTCTGC 
AACTTCATGGTTAGT C C TTTAGGGTTTTTC ATTCT C C CTTACTTATTGTTT AATTTAC AG 
ATTTACTCTTTTGTTCATTTGACAAATATTTGTCAAATGCTTGTGCACAGTCTGTATTCT 
CAAATTCTAGGAGAAAAAGAAGGGTGAACAGTATTAGCGCAGAACGATACTAATAATGAT 
GGCTACTGTGTATGAGTAGCCAGCCCTTTCTTGGCTTTCTTGGATTGCTTTGTATTCTAC 
ATGAAGATATTCCCTGGGCTTTACAGGTCAATAAATGGAAATTCAGAGAGATTAATTTGA 
CCAGGGTGACCAACAAGGAGATGACAGCATACACTATGCGAGAAGTATACACAGAGTAGT 
GTAGGAGCATATAACCTAAACTGGGGGTGAGGTGGGATAAGGAGTTATCAGGGAAGGCTT 
TTTGGAGGAGTTGACAACTGAGCCGAGTTTTGATGGAAGAGTAGAAATTAGCATGAACCA 
ATTTCATGCTAATAAAGAAGCAAAGGAAGCGTGGTCTACAGGCAAAAGCACAGAGGTACA 
GGAAGTAATGATATGTTGGGGAATACCCTGTTGACTGGAGCTTAGAGTGCAAGGAGAGGA 
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GTGCTAGGGAGGTGAGGTTGGAGGGTTTGGCAGCATTGACTTGCTTCAAGGTTCTTAAGA 
GCTGAAATAGATATAAAATGCAACTAAGAGTGGCTTGGATTATTATTACCTAGTGTGTTA 
ATCTCAAATTTTGAAATCTATAGCATCTATAGGACTGGTGTTACTAATCTTACACTCGAT 
CTGTTACTGTTCTTATACTAGATCTATTAGTCCAGTGTTTAAGGGAGTGGTGCAGATTTC 
TAGGTCAGGACAGGACTCAGATGTACATTATTAATGCCTATTTCAGTTCTGACCTTCTCA 
TATGAAACCTTATAAGACCTGGGGTAGGAAGAGATTGTTCTGGAAGTCATAGGAATATGA 
ACTGTATTTTGTTTAACAAACAATACAGTATGGAAATTTATCACCCTTCCAGAATATTTA 
TTTCAGAGACAAATTTTTATCATTCGTTCATTTATTTCATAAGATCCACGAGTAGGGAAC 
CTCACTAGACATTGCTCTGAGTATATGGTCTGAGTTTGCAGTACCTCTTGTGTCTCCATT 
AGATTTATTAGGTCCTCAATAGATAAATCAGGGAATAACTAGATGGATTCATTTTTTAAA 
G AC ATGAAAGAG CG ATAC C AT AC ATACTG C A C CTT AAAGG TC AACC TT AG AGT AT C ATT A 
TTTTTAATG AATGT AT AATTTTT AAATT T C ATGTTT ACTTTT C CT AAG CTT TTG C AC T AT 
ATTGCTTAATTCCAG CTTTGAATGATATGATAAAAGAGTTTATCTCCATGGGAAGTTTGG 
TTGCACTGATTGCCACAAGTCAGTCTCAGCAATCTCTACATCCTTTACTTGTTTCTGCTC 
AAGGAGTTCACATATTTCAGTGCGTCCAACACATTCAGCCTCCTAATCAG GTAATACACT 
ACTTGTAAGGATTATTGAATTATGTCCCTTTTATAGAAATTATTTTTCAATTTTATTAGT 
AATTCGTGGCTTTAAATTTATGCTTCTCTTAATGATTTTAAGGATATGTAAGTCAACATT 
TGGTGCATATTGTGCTAGAGGCATAAATTATAATTTATAGCCACCTGAAATGTTAGTATG 
CGCTTTCCAAGAAAATGACTTTTTTGAAAATGGTATTTCTTTGAATGAGAAAGAACAGAG 
AGAAATAGATAGATGGCTTTTAAACACTTCATTAATTAAACTTTTTTTTTCCACCATCAC 
ATAATGGCACTTAGTCCCCTTTGGGAACTCATGAGGGTTTTAGTGGTAGTGAGCTGAAAG 
AAAT ATGTT C CAGGACTGG C AAA CAT ATTCT AAATT C TTTAAAATT TT C AC CTAG C AT CT 
ACCCTAAATATTCAGACCCTGTGCTAGTTAACTGCTATTGAAGAACAAAGGTATTATATC 
TATTATTAAGGATAATAGAATGGTATTTGAGATATTGGTCATTGAATATGAATATGTTTT 
G AG AAAT AAGTTTTAT AGGAAC C AAAAAAAAATT CT TAAAGG AAC C ATAT ATT AC T AAAA 
ATGCTTCTTATTGGAGAAAGAAATGACAATCATTTATTAATGTGATTTTTTCACAACTTT 
ATTAAGATATAATTTAAGTACAACAAACTCACATAAAGTGTACAATTTGATCAGTTTTAA 
C AT ATGT AG ATG C C ATGAAAC CAT CAC CAC AAT T AAGG AAAC AAAC ATTTT C AT C A CT C C 
AGAAGTCTCCTAGCCCTTTTACTACCCATTCCTCCCCTGCTCCATCCCCAGACAACTACC 
AATTTG C TTT C T G TCAC T AT AG ATTTG T C AA C C TGATTTT CT C CAAAT AT ACATT C AAAA 
ATATACAGTTGAATACAATTGGAAATTCGAATTTTGTGTTTTTTTCTTTAGGAACAAAGA 
TGTGAAATTCTGTGTAATGTAATAAAAAATAAATTGGACTGTGATATAAACAAGTTCACC 
GATCTTGACCTGCAGCATGTAGCTAAAGAAACTGGCGGGTTTGTGGCTAGAGATTTTACA 
GTACTTG TGG AT C G AGC C AT AC ATT CT CG AC T C T C T CGT C AG AGT AT AT C C AC C AG AG AA 
AGTATGTTTTACTATTAAAACCTGAACTTGGAATCTTCTTTCTATTGTGGAGAAATGTAA 
TTGTAGTAAGACAAGAATTAAATATATTCCATTGTAGTATTTGAATAAGCAGTTATTTGA 
GTAGAAAATT AG TGTTT C C AG CT AAG ATGAT GG C AT ATTTTG AAAATT CAT AT AGTGAAT 
ATAACTAGTAAAAGAAGTTTTGTTTATTTTTAAACAG AATTAGTTTTAACAACATTGGAC 
TTCCAAAAGGCTCTCCGCGGATTTCTTCCTGCGTCTTTGCGAAGTGTCAACCTGCATAAA 
CCTAGAGACCTGGGTTGGGACAAGATTGGTGGGTTACATGAAGTTAGGCAGATACTCATG 
GATACTATCCAGTTACCTGCCAAG GTATGTTTAAAAAAAGAAAAAGTGAATACTTACTCC 
CAGAAGAACCACTGTATTATTGGCTTTGGCTTTATGTGTCAGCTTGCCCAATCTCCGTGT 
GAGTCAACAAGTGTTTACTGAGTTACCAAATAAATGTCTTAACACTATTTTAGGTACTTT 
AACAAATTTTAATTTTATTAATTAATTTTTTATTAGAATTGAGACCTCACTCTGTCATCT 
AGGCTGGAGTACACTCACAGCTCACTGCAACCTCAAACTCCTGGGCTCAAGCAATCCTCC 
TGCCTCAGCCTCCCCAGTAGCTAGAACTACAGGCATGAACCACCATGCCCGGCCAACTCT 
TTAATTTTCTTAGAGACGGAGTCTTGCTATGTTGCCCAGGCAGACAGATTTTAATGTGTA 
TGATGCAGTCTTTGATGATAAGAAACTTATAATGGAAAGCTGAGGTGATAGTTACAGTAA 
ATACATTTTGATGTATAATTCTGTTTGCTTTAATCATTCAAATTGTAGTAAAGCAAGATG 
AACTGTCTGCTGGGATTTGAGCAGAAATGGATAGGAATAAACTAGGAGGTAGAAGAGTTA 
TCAAGGTTCACAGGACTGATGGGTGAAGCTAGATTTCCAGACCCGGGATGTCAGTCCTTG 
AAAAGCAGACTTGGCAGGCATAGACGAGGCAGATAGCAGGATAAAGGAGACAAATGTAGA 
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TTGTTCTTCAGAAGATCAGATGGTAGAGTCTAGGAGGTAGTGTGTTTTAATCAGAGATCT 
GAGAGGCAAAGATCATTGCATGAGATCAGGGACCCATGCAAAGGAGTGAGAAAAAAAACT 
GGGTTAAGGAGCCTGCTGCATGGCAACTCCTGGGAACAGTGGCCACTGGGGCCTGGGACA 
TGTTGATTGCAGCCCAGGACTGTTAAAACCAGTGTGAGAGAACATGGGTATGGAAGTACT 
AGCTAGCAGGATCATGACCCCGATGCTGGGATGGGGCATCAAGCATTAGTACATGGAGAT 
TCAGTACATCCAGATGCAGTACATGGAGACTATATGCGTAACTGCTGACTTTGGGCTTCT 
TTCAGATTGGAGCAGAGGTAGAGGTGAGTGGGAATATTCTCAATAGAGGGAACTAAATAG 
G CAT AC C T AAT AAAG G AG AC C AGG AT ATTGC AG AC AG TAGCCTCATGTTTGGCTCACCTG 
TTCAAAAAGTTCTCTTGTTCTTGAGCAGTGGTGCCTTAAAAGGTAACTTGAGAAGCAGTC 
GATTATTTGTTCAGCCTGGAGACTCTTGGGATATTTTACTATCTTTGATTGAATAGATTT 
AAATGTACACAGCTCTCATAACTTGCCCCATGAAGCATATCCATGAAAGGCACTATACTT 
GTTAAAAGATTGGTTTGTACTTTTTAAATGTAGTACTTTTAATAAAACAGGAAAAATAGA 
AGTT CTG ATG CAG TTAT ATG C ATTTT AT AT AG AATG TG TTC TT AAT TGG AAAAAAT TTG T 
CGTAGTTCCTTTGAGTTCATTTACAGTTTTTAGTAGGAATTGTATTTTCTACTGTTGTAC 
TTGCTGTTACTAAAGAAAGATGGTCGTGATTACCATCTGAATTTTTTTTCTATACATTGA 
T CT TTAG CTGCT ACTT AG T C ATTT CT G TTT AG ACTTG AG CT CTTTT T C AT AT TTTTTTTT 
TTTGTTTCTCAG TATCCAGAATTATTTGCAAACTTGCCCATACGACAAAGAACAGGAATA 
CTGTTGTATGGTCCGCCTGGAACAGGAAAAACCTTACTAGCTGGGGTAATTGCACGAGAG 
AGT AG AATG AATTTTAT AAG TGT C AAG G T AT G TTG T CT ACTTAT CTT CTTTTTTT ATTT A 
GGTAAAATTAACATAAATGCAGTTAGCCATTTCAAAGTGTAAATTCACTGGCATTTAGTG 
CATTCACAATGCTATGCAACCACCACCTCTCTCTAATTTCAAAACTTTTTCATTCCACTC 
CTCCTCTTGCTTATCCCCTGGCAACCATTCATCTGCTTTTTGTCTCTATGGATTTGCCTT 
TTCTGTATATTTCATATAAAACAAATCATGCAATATGTGACCTTTTTTGTCTGGCTTCTT 
TCACTTATGTAATGTTTTCATGGTTCATCCAGGTAGTAGCATGTATCAGTACTTCATTCC 
TTTGCATGACTGAATAATGTTACCATACTTTGTTTATCCACTTATCAGTGGTGAACATTT 
GAATTGTTTCTACCTTTTGACTATTATGAATAATGTTGCTGTAAATATTCATGCACAAAT 
TT C TC C ACG G AT ATGTT TT C ATTT CT CTTG GG T ATAAAC TG AGG AG T AGAATT C TTGGG T 
CTTAGGGTAATTCTCTAACTTTTCAAAGAACCACCAAACTGTCTTTCACACCAACTGCAC 
CATTCCCACTAGCAGTGTGGGGGGTTCCTGATTCTCCACATCTTTACCAACACCATTATG 
TTTCTCAATTGTGGGCTAGTCTCACATTTGGAAAGCTAGTGGGAGCAGCGATCCATCTAT 
TAAAAGTTGTATGAAATTGAGTAATGAGCCACCTCTCTCTTGTAGGGCTTATTATGTTCT 
TGCTTAAGGCAATCTTCATGCATTGTGAAC AGAATT ATACATAAATGCTC AG AT AAAAGG 
GCAAACCATTCTTAAAGGGAGTAGACAACTAGAGGCAGGAGACCATACTGAGGCAGGAAG 
CTGGGGTTTTTATGGTTCTGTTACTTTTGACTATATCTCACCATTGCTTTTGTCAAAGTG 
AGACTAGGTCTAAGTTTTTTTCAGGTATAAGGTGAGTGTGGTAATTAAGGGGCATGCTAG 
CAGATCATTTTGGGTAATGCTTCACAGTCCACCACTGGTGTGTCATTGTGGTCGCAGATC 
CAGTATCTTAGCTGTGTAATTTCAGACATCAGCAATATTAGTTTAACAAAGGGCAATTAG 
ATTCCAAGACAAAGGAATCGTGTATTATTCTAGCCTTATTCAAACTTGATTTATAAATCA 
GTTTAGTAATTTATTTATTTGTTTCTGTATTTATTTTTATTTCTTTGAGATGGAGTCTCA 
CTCTATTGGCCAGGCTGGAGTGTAGTGATGCAATCTTGGCTTACTGCAACCTCTGCCTCC 
TGGGTTCAAGCTATTCTCCTGCCTCAGCCTCCCGAGTAGCTGGGATTACAGGCTAATTTT 
TGTATTTTTAGTAGAGATGGGGTTTCACCATGTTGGCCAGGCTGGTCTTGAACTCCTGAC 
CTCGAGTGATCTGCCCGCCTTGGCCTCCCAAAGTTCTGGGATTACAGACGTGAGCTACCG 
TGCCCAGCTCAGTTTAGTAATGTATAACTGGGTTTTACCCAGTTGTAAATTACTCTTTTG 
TCGTGTTTTTTTGAGAACTGGCAATGACGGAGAAACTAAAAGTGCCAGGCTGTTGCCTTG 
TTCCTGTTATTTTGCCTTAGTTTTTTTTTTTTTTTTTTTTTTCTCTGAGACTGAGTCTTG 
TTGTGTTACCAGGCTAGAGTGGAGTGGCATGATCTCGGCTCACTGCAACCTCTGCCTCCT 
GGG TTCAAGTGATT C CTGC CTCAGCCTCCCG AGT AG CTGGGATTAC AGG CGC CTG CC AC C 
GCACCCGGTGAATTTTTGTATTTTTAGTAGAGACGGGATTTTACCATGTTGGCCAGGCTG 
GCCTCGACCTCCTGACCTCATGATCCACCAGCTTCGGCCTCCCAAAGTGCTGGGATTACA 
GGCGAGAACCACCGTGCCCGGTCTTGCCTTAGTTATTTCTTGTTCCCTCCTCTAGTCCTA 
TAGTTCTCTGACTGTATTGAGGAAATGTAATTAAATATTATTATGTTAATAGATATTTAT 
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GTGGTTGAATATTAGAAATTCCTTATTTTGGTCACATATCCTGATCAGTAGTTGGTCTTC 
TGGAGATAGTGATTTTTCACTAGAGATGACTTTAGGACCTATTCAGGTTTTTTTTAAGAT 
CCCAATTTAAGGAAAGACTATTCTCATTATTGATTTTGCTATATGCAGGGAAATTTATTT 
CGAAAGGTTTTTCAGTTGGCTTTTAGGGAAGATTATATATTCTCTTTTTTTTTTTTTGGC 
CTTTTCCCACATGTTCTAAAAATGATATATTCTTTAACTCCTATGAAAATACATTGTTTC 
AGTAATTGAAGATGCTGATTAAAGTCATATCTCTACACATTTTTTAAAATTTGAGATAGA 
TGGGACTTTGTCCCTTCTTACACCATTCACTTATTCACTTGGAAAAACTATTATCCAATA 
CTTATGTGGCAGACACTGTTTCTGGCACAAGGGATTCAGCAGTGAACAAAACTGCCTTTT 
TGG AGTT T AC AT TCT AC T AG TGG AAAG C G AC AAC AAG CAG AT AG AC AC AT T C AGT AT AT A 
ATTCACTGTCAGATGGTGGTGGTAAGTCCTATGTAGGAAGAAAAGCAGGGTAAGGAGGCT 
TGGAGTAACTGGAGTGAGTCATAGATGGACTTGTCAGGAAAGGGTTTCTGAAGAGGTGGT 
ATTTGGG C AGAG AT CT AAAT AAAATG AAGC AAC AAG C CATG AG AAT ATC C GGGGG AAAAT 
GTTCTGGG CAG AAG CAT C AAG C AT AG AACTTG TGG T ATG AT ATTT ATTCTAG C AC AC ATT 
AATTTTAAAAATGTATAAAAGACATCCATTTAATCATATTAAAGATTTCCATGATTCATT 
TAGACTTAGTCAGAAACCAAATTTATATTTTCTTTTTAAATAATTTTATCTCAACTCTTA 
TTTT AC CC AAT AG GGGCCAGAGTTACTCAGCAAATACATTGGAGCAAGTGAACAAGCTGT 
TCGGGATATTTTTATTAG GTTGGTAGCCTATGAATGTTTTTAAAGTAACTGACTCTGTTA 
TTATT TATC AAT C AGTG CTTT TTTTGGT CTT G TTTTTTG AAG AACTG AT ATTTG AAAC CT 
GTGGTTTATGTGAATTATTAATAAGCTAGAGGACGTGGATTCTCTATTTCATCAAATAAT 
ACAAAACATTTTAGATATTAAATTTTGGAAATTATTTGGTTTTGTTTTACAATAGAAATA 
CTCCTCAAAGTGGAATCGAAGTGGTTATTCAAAGAAATCTCAGAGTAGATTCTTATATGA 
AGCAAATAATTGCCCCTAATTTATCTCTAAATTTTGTAAGTTCTAAATTCTTTTTTCCCC 
C AGTTTCT AATT TAT CT CT T AT AAGT CAAG AGT CC ATCTGG C CAAT TT AATTTC AG TG AG 
TGTAACTATTTTGCATATATTAAAAAACTGTATATGAATACAGAAGATGGTATTTAAGGA 
TGAAAATAATTATTCAAATGTGATAGCATTATGGGGAGTTTTAAAATAAAAGTTACTGTT 
TTATTCTTCCAAAAATTTTATTATAAAGTATACAGTTAAGAGAATATACATAAAATACAT 
ATGCAGCTTAAGGAAGAATAATAAAATGAATACTTCATGTATTCACCACCGAGTTTACCA 
GGAAAAAGCATAAACAAAATAAACCTCTTCCACGTAATTCCTGGGTTAAAGAGAAGTTAT 
AG TGGAAAAT ATTTGGG AG CAAACG AT AATG AAAAT ACT AT C CATT AAAATTGTTAG ATG 
TTGCAAAACTGATTTCAAGGAAAATTTATAGTGTTAAATGTTTAGAAAAGAAAAAAGGTT 
AGAAGTTAACCACTTATGTATCTATCTCATGAAATTAGGAAAATTATAGATATAAACTAA 
AAAATATGTTAAAAGGGAAATAATAAAGATAAGAATGAAGTTTAATGAAACACAAAACAG 
AGAAGCTCACAAAGCCAAGATTTATTTTTTGAACACCGAGTACAATTGACAAATCTCTAA 
CAAGTTTGATTAAGAAAAAAGAAAGCATGAATAAACAATTTTAGGGATAAAAAGGGAAAC 
ATCG CTAAAG ATATC C C AG AAATGT AAAAG AT AAT AAGGG AATATT ATG AAAAT AT T C AT 
GCCAATACATTTGAAAACTTAGGTGACATAGACAAAAACAAAATTGACCAAAATTGAGCA 
AAAAAGAAACAAAATCTGAGTAGTCCTGTAACTTAGTAAAAATTGAGTTAGAAAAGTTAA 
AGAAGTCTTTACACAAATCAAACATCAGACTCAGTTTTCTAGGAGAGTTTTGCCAAACAT 
TCAAGTAGCAGATAATTCTGGTCTATTTTTGGCCCCAGAAGATATATTTTACTTGCCATG 
CATTTAATGAGATAGCTGTTGATTTTTTTCAATCACCGTGACAGGTGTTTTATATTAGGT 
GTTATTCGCCAGACATCTAGTCCACCTGTTGCCAGATATGG AATT AATATT CACTTATTT 
TGAATTAAAATTTGTTAATAAATTAATAAAACAAAGTCAAAGTTCAAATTATTAAAAAAG 
TAAAAGAAATAAAATATATTTTATAGAGAGCCCTTACAAAACAGTACCAACATAATGAGC 
TTTCCAAATTTTGAATGGGC AAAAT AAATGAATAGGCATTTCACAAAAGAAGGAAGGGTG 
GCCAATAAGTATATATTAATATAAAAATGGTTACTTGTAATAGGAATCAAAAGTGTTTGA 

CTT ATTG ACT AAGAGTCAGTTTTTGTTTTG AT C C CTGTT AG TCTAT C C AG AAGG C ATGGG 
TCTTAATAAACACCTTGACCTCAACAGTTTACTGAATACAAGGGTAATTTCATATGCCTT 
GC C TT CTTT AAG GGTTTGTTG T AAAG ATT AAAATAAAT AC ATAAAT AT AT AT AAAT ACAT 
TTATATGTATTTATATGTAATTACATACAACTTGCCTTCTTTAAGGGTTTGTTGTAAAAA 
TTAAAAGAAGTATATAAATATATATAAATACATAAAATAAATACATTCATATATGTATAT 

GAAAT CACTTTG C C AAC T ATG AAG C CTG AT T CAAAT ATG AAATGTTG TTTG TTTTT C C C A 
G AGCACAGGCTGCAAAGCCCTGCATTCTTTTCTTTGATGAATTTGA ATCCATTGCTCCTC 
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GGCGGGGTCATGATAATACAGGAGTTACAGACCGAGTAGTTAACCAGTTGCTGACTCAGT 
TGGATGGAGTAGAAGGCTTACAGG GTAATAATTATAAATACAGAAATAGAATGTTATAAC 
AAAATGTCATCATGTCATCAGATTTTGGTAAAAAAATGTTCTTTTTTCCTCTAGGTGTTT 
ATGTATTGGCTGCTACTAGTCGCCCTGACTTGATTGACCCTGCCCTGCTTAGGCCTGGTC 
GACTAGATAAATGTGTATACTGTCCTCCTCCTGATCAG GTGACAATTTCATATTTAGAGT 
CCAAAACCCAACAAATGCTACACTCTTTCCTTGTGAGCTTTACTTCTGCCAGGTAATGGC 
AATTGTC CTT AG AAG A C C AG C TTT C TT AGGG AAAAG CTTT AG C C AC TGTT T G CT C AAAG C 
AT AAAAAG ATTC T GAATT AG ATG C AAAG C CTT TTTTTGG C C C AG TG C AAG T C T G AAAAC T 
TTGTAAT CCTTCTGTGTTGGCTG ATTGGGGAAAAAAAAATG CAAG AAACCT AATG T ATT A 
T ATTTTC AC ATT ATCTT C TGT T C AAAG ATT AC AT ACTT C C ATT ATC C TG T C AAAAAAAAA 
ACT C TG AT AC AG AATC AAG C ATG TG AAT C GT AAG C ATG TAAGC AGGT TTC AT AG AG AT AA 
TTTTTCAACTCTTCCTTGTCCTGTGTTGTTCCAACTCTTATTCTCCAATTTAGAAGCAAA 
CAAATAAATGAATGAAAGAACAGATAGACAAATGAATAGTCAAAGGTATAAAGTATCTGT 
AT AT ATG TTACATGT AG C T ATT ATTTAAATTATTTAG ATTTTC CTTT TGAAAT AC CTT CT 
TGG C ACACTTGC CTAAAT CT AG AAAAT AAGC ACTG TG TG AAT AAG AAATT AT TT AC ACTG 
AATATTTTGTAGGTTTTTGGGTTTTTGTTTTTCAGACAAGGTCTCACTTTGTCACCCAGG 
CTGGAGTACACTGGTACGATCACAACTCACTGCAGCCTCTATGGCCCAGGCTCAAGCAAT 
CTCCCCACCTCAGCCTCCCGAGTAGCTGGGACCACAGGCACACGCTACCATGCCCAGATA 
ATTTT AT T ATT AATTTT TGTAT AG AG ATGGG GT C T C C CTGT GTTGC C C AGG C TTT C TTG A 
ACTCCAGGGCTCAAGTGATCCTCCCACCTCAACCTCCCAAAGTGTTGGGATTACAGGCGT 
GAGCCACCATGCCCAGCCTTAAGAGTGTTTGATTTTCATTCATTTTCCTATATATATTAT 
TTCTGTTGGGGAAAAAATTCCAAGGAAGATAAATAGTAGGCTGTTGGTACATTTCTCAAC 
TT ACTT ATAAAG CTTTTT AG AT ATATAAGGT T AATTT ATGAAGAAAATC AT AAG AT A C A C 
AATTTAAGATAATATTTTTAATTTTATTTTTTATTTGTTAAATAAATTTTTCTCCTTTCA 
G GTGTCACGTCTTGAAATTTTAAATGTCCTCAGTGACTCTCTACCTCTGGCAGATGATGT 
TGACCTTCAGCATGTAG CATC AGTAACTGACTCCTTTACTGGAGCTGATCTGAAAG CTTT 
ACTTTACAATGCCCAATTGGAGGCCTTACATGGAATGCTGCTCTCGAGTGGACTCCAGGC 
AAGTTATATGAGGAAGTTGTTATGACATTTTATGAGTGATAAAAGAAGTACAATGTCAAA 
ATTTCCACCTTAAAAAATGCTATTTTTTAAACAACTTTGGTAAAACTGTATAGAAACATA 
AATTTACCTTTAGTTGAATGTTCCATAGTTGGAATATGGGTTTTGCAGAGAATTTATAAT 
TATGAAGTTTGATGTCTGTTTCTTTAACATTACCTTAATATTGGCAAAAACATGTTGGTG 
TTTGCAAGGATATTATTTAAATTGGGATACCATGAATTAAATACTACAAACAAAAATAAT 
TAGAGTTTTTTGTTTGTTTGTACTTTAACTTTTAAAAAATAATCAGTTAAAGTTGTTGTT 
TTGAAGCTCACATTGTTCCAATCTGGCCAATAGGAGCCCCTTTTGTATGGCTCCTGTATC 
TTTATGACATGTCCTCATCATTCTTGAATCACTTCCTCACTTCCAGATACAGTAAGTTAT 
TCTTGGCCAGGTGCAGTGGTTCACGCCTGTAATCCCAGCACTTTGGCAGGCCAAGGCAGG 
AGGATCATTTGGGCCTAGTTTGAGACCAAATCATGGTTGCACAAACTGTACCCACTATGG 
ACAACAGAGTGGGATCTTGTCTCTGTGAAAAATTTAAAAATTAGCTGGGCATGGTGGCAC 
ATACCTGTAGTCCTAGCTTCTTGGGAGAGGCTGTGGCAGGAGGATCGCTTGAGTAAATCC 
AGGATGCAGTGAGCCATGCTTGTGCCACTGCACTCCAGCATGGATGACAGAATGAGACCC 
TGCCCCCAAAAAAGAAAAATATTCTTGGTTTATCTTGTACTTTCTGTATCCCAGCCCTAG 
CATCAGCCTTTTCTCTAAAGACAGTATTATGATTTTAATATTTACAGTAGATATTTGAAC 
TGTTACATTATAGACTTTACCATATATTTTCTAGGAAGGATTATTCTATTACTCTTCTTT 
ACCACATTTGTTTGGAATGTCTACAGAACCTACAGTTTCTAAATCAGAAACTCCCTAGGT 
TTTTGCTATTTTGGCAAGCCATTGAAGTTCTTCCCTCTCCCTTTACTACCAGAAAGGTGT 
GTATTTGTAGAGCTCTCTATAATGAGAAAGCACTCTATAACATGG TTG ATT CATC ATTTT 
GGAGTAGAAAAGTATGAATGGAAAGTCAGAGACATAAAAATAAAGCCCAGAGGTCTGAGT 
CTTAGCTTCATTACAGACTTTCTTGGGGGATGGTTGGTAAATTATCTACACATTCTATCT 
TGTCTTTATAATTTTAATAGTTAAATTTTTACCATGTGCCTCAAAACCGTTAGAGAATTA 
ATGAGCTCTTTGAAAAATGCTTCTAAGTTTCTTGTATTGCTCTAATAGAATGCTATCTAT 
GTTATTATTTATTTCTGAGACTAAAATTGTTTACATCTTTAAACTGGTTGTCCTTTTGTG 
T ATTTT AG G ATGG AAG T TCC AG CT CTG AT AGTG AC C T AAGT CTG T CTT C AATG G TC TTT C 
TTAACCATAGCAGTGGCTCTGACGATTCAGCTGGAGATGGAGAATGTGGCTTAGATCAGT 
C C CTTG T TT C TTT AG AG ATGT CCG AG AT C C TTC C AG ATG AAT C AAAATTC A AT ATG T AC C 
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GGCTCTACTTTGGAAGCTCTTATGAATCAGAACTTGGAAATGGAACCTCTTCTGATTTG G 

TATCTTGTGCAGTCATCATTATACAGTTCTGAAATATAAAGCTATATGTTGGTGTAAAGT 

TGCAGTGATTTCTCTCCTAACCAGCCCCACATATTCTTCCTGGTTGGTTGGTTCTTCAGT 

AAAATAGTCTTGTTTCTTGCTTACACTAATTGGTAATTTGCATTCCTTGTTAAGATTTTC 

AAGACAGGGCTGGGAGCAAGGAACCAAAGTAGCGCGTGGTTGTGATTACCTTTGGTTTCT 

TTGAGGTTTCTCTTACCTAGTGGCTTTAAAACATCTTTAGGAGCAGTTCCATTTTATAGT 

AAACTTAAATTCTGTTATCATGAACAGTTGAGGATAATGAATAATTTGATACAATAATGT 

AAGAAATTCCTGAAAACAAAGTGTTATCTGTGATACTTTTGCTGCATAGTAAGCACAATG 

AAGTGTACTGATAATGTTTCAACAGGAAAGTGTTTTGATTAAATGTGGGCAGTATCACTG 

TTCTACTAGCATTCAACATCTCTTCTAAAAATTAATAGTGGTTCACTGTAATTTTATTGG 

TACATGTAACATCTGTACATGTGTTTGGTTATCTATATGTTTCCTGGTTTTTTGTACATT 

TGCTTTATTAATTTAGGCTTTTTTTTTTTTTTTTTTTTGAGACAGTCTCACTCTATCATC 

CAGACTAGAGTGCAGTGGCACAATTATGGCTCACTGCAGCCTTGACCTCCTGGGCTTAGG 

TGATTCTTCCACCTCAGCCTCCTGAGTAGCTGGGACTACAGGCACATGCCACCATGCCCA 

GCTAATTTTTGTATGTTTTGTAGAGACGAGGTTTCACCATATTGCCCAGGCTGGTCTCAA 

ACTCCTGGGCTCAAGCTATCTGCGTGCCTTGACCTCCCAAAGTGCTAGGATTACAGGTGT 

GAGCCACTATGCCTAGCCTAACTCAGACTTTAAAAATATAAAAGCAATTCATTTTTATTC 

CCAAGAACAGTAAGGTGGTGGTTTAATTTTAGTCTTTAATTCTGTTTTTAATTTATTCTA 

TTTAGAAATGTCCCAGAAACTTAGTATAACTTTACTTTCTGAAAATGAAGAAACCTGTCC 

TTGGGCATTAGTGTGTTGGATTTAAGCAACAAAGTTAAAAAAACCTACCCTGTGTTATGG 

C AATTTT C AC TT G ATGG TGG TTCT AT AAC AC AGG T AT C AGT G AAC CTTT AT AAAAG ATG A 

ACAACTTTTCAGCTTGCTTAATTTCAGTTAATTAACATGTATACTTATCTATGTTAATGT 

TTTATTGCTTAAAATGTTTAATTTTTATATTTGGTAAACAGATAGTTTTTTCTCTCCCCC 

T CTTC CTTC C AT CTTT C ATT ACT AC AATTT A C C ATG CAG AG CT C AC AATGT CT C TC TG C A 

CCAAGCTCCATGACTCAGGATTTGCCTGGAGTTCCTGGGAAAGACCAGTTGTTTTCACAG 

C CT CC AGTG TT AAG G AC AG CTTCAC AAG AGGG TTGC CAAG AACTT AC AC AAG AAC AAAG A 

G AT C AAC TG AGG GC AG AT AT C AG T ATT AT C AAAGGCAG AT AC CGG AGC C AAAG TGG A G T A 

TGG CTTTTTCCCCCTCATTATAATTGTTAAAACTTCTTAAAAATTGTTTCACCCTTTTGA 

TATATATTTCTTTGACTTATAAACGAGCTATATTTATAAACAAGGGACCAGAACACATTA 

ACTCAGTCATGGTTATGTGCTTCCTTGCTTTCAATGTTTCATTATCTTATAAGGAAGAGA 

ACGTATGGTCTCTTGAAAAAACTGACAATAAGAAGTAACAACTGGACTACCACATTTTTT 

TTTACATCCTTAATTTAACTCTTCGTCAATTTCTTTTTTTACTTAAG GAGGACGAATCCA 

TGAACCAACCAGGACCAATCAAAACCAGACTGGCTATTAGTCAGTCACATTTAATGACTG 

CACTTGGTCACACAAGACCATCCATTAGTGAAGATGACTGGAAGAATTTTGCTGAGCT GT 

AAGTAACAGATTCTGTTTTGGAAGTACAGCTACTATTACAAGTGACATAGTATTACACTT 

AAACCTTTAAAGTTCGTGTTTAAAATAAAAATATTTTGAATATTTAAAAGCTAATTCAAA 

AAATATGTGTCGTAGCTATG CAT TAAAAAAC C C CAAAATGT C AG AAGT AC AG AAGT C AAA 

ATTGAGTTTTCATTAACCAGTTCATTTGATTATATTTGAATTATTCATAATGGACTCATT 

TAATTTTAGTAACTTTGGGCTGGGTGCTGTGGCTCATGCCTGTAATCCCAGCTCTTTGGG 

AGGCCAAGGCAGGTGGATCACCTGAGGTCAGGAGTTCGAGGCAAGCCTAACCAACACGGG 

GAAAC CC C AT CTCTACTAAAAATACAAAAATT AG CC AGGTG TGGTGG C ATGTG C CT G TAG 

TCCCAGCTACTTGGGAGGCTGAGACAGGAGAATTGCTTGAACCCAGGAGGTGGAGGTTGC 

AGTG AGC C G AG AT TGC AC C AC TGC ACT CC AT C CAGC CTGGG C CAC AG AG C G AG ACT G TGT 

CTCAAAAAAAAAAAAAAAAAATTTAGTAACTTCGAAGAAATAAGAAGGAAAATTAAAAGT 

TGAAAGTG ATT C T AATGT ATAGTTT ATAAAATTTTGTT AT AAAAAT AC CTG TTTTG C CTT 

CAAAATAATTTATATTAATATTTTATTGACCTCAAGAACATTTAAATACATTCAGATTTA 

TTC ATTTGTGG A C C ACATTTGTT ATAC AT TGG ATTT AAAGG AT C CT TGC AATTG AG TTT A 

TGGCCACCTATGCATCTGAGACCCATGGACTGGGAACCATTCTAGGTCAATGATTCAGTG 

TG ATTC AATTTAAG AG ATGTT T ATT C CTGG T CTTT AG AAG CTG CT AC C TTTTGTT AT C T A 

ATTTTGCAGTACTTTGAAGTATGTATGTATGTGTACATACGTTAGTGCTATGTATTTATT 

AAAG AAG AATC AG AAAAC AG AGGTAAGG AAAAAT AAGGAAACAAAT TT C TG TT AAG C C C A 

CCACCTCCCAAAGCATATTTGTTTATATGCTTATATATGTTTTCCTATTATGGTAAGAAC 

AGTCTGTACATATTGCTATATAGCAGTCCCCCTTTATCCACATACATCCTGAAAATTGTT 

TTACATTTTAAATGTTAACTACTTTATTGTTTTTAAATGTCATTTTATAGTGTAGCTATG 
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C C AC AAT AT C C AATTTTT AGAC ATTT AAATTG C T C C C AGG C AATGT GG T AATG AA C ATT C 

TTGCAGCTGAATATATGCACATATCTAATTGTTTCACTAGGATAGAGGTGGAATTGTATA 

ACAGGGAGCTCACATTTTTTAAGGCTTTTGAAATGTATTGCCAAATTGCCTGCCAGATAT 

ACTGCACCATCACTAACATTGTGTGTTGCAGTATTTTTCTAAACTTGGCCCTTTTGATTT 

T AG AAAAATG AT ATCAAT AAT TT AC ATTT CTTTG ATTAAAG TG T AG AAG TT AT AAT TTTT 

CATATTATTCATTGTCATTTGTATTTTATCTTTTCTAACTTGTCTCTTCATCCCCTTTGC 

TCCGTTTTCTATTGGAGTGCAACTTTATTTGTAAGAATTCTTTTTAATTTCTGTGACTGG 

AATTTTTTTTTCTAGTTTGTTATTTCCCGTTCATTTCTTAAAATATAATTGTGTTTGCCA 

ACAATCCATTATCTTTTGTTTTGTAATGGTAGTATTTATACATATTAAATTATCTCTTTC 

TTTTTTCAG ATATGAAAGCTTTCAAAATCCAAAGAGGAGAAAAAATCAAAGTGGAACAAT 

GTTTCGACCTGGACAGAAAGTAACTTTAGCATAAAATATACTTCTTTTTGATTTGGTTCT 

GTTAAGTTTTTTGATGGCTTTTCCATATGTTGTAACAGGAAAAAAATGGTGTCTATGAAT 

TTCTTCTTAATTTAACAAATTTGGTTAATTTATAAAATCACAGATTGGTAAATGCTATAA 

TTATGTAATGATCAGGATTGAGATTAATACTGTAGTATAAATTGGGACATTATAACAGAT 

T C C ATATTTT ATTT C CT AAAAT CT AAATTC AGT CTTT AATG AAATAAT ATT AG C C AAATG 

GTGGAACTAATTTATTTCTTTTGAGGAAAAGATAATAAAGAATGTAATTAAATTTAAATT 

TCTTGGAATTCCCAGTTGTATATTCATCACCTTTGTAGCATTTGACAAATTTTATGCTTA 

GCAGCTTCTTCACTGTTTTGAAATAAAATATCCTATTACCTACTG ATACAATTATCTGTT 

CTTTGTATATCAAAAAATGTGAAATTTACACATAATTCAAATACATTTAATTATCCGCTC 

AACCAGAAATGAAATCACATCCCTCTACTATACTACATCCAGCTCCAAGCCCAAGATATT 

TAAATGACATCCATTCCTCTCCTAGTTCCAGTTATGATTTTATCTTGATATTCTCTCATA 

TATGAACTAAATTATAAAGTTAGCCACCATCAATACAATCTGCGTATCTAATATCTTAAC 

TATATAGTAATGGGGTAAGGGAACAGCAAAAAGGAGAACATTAATTAAAATATACAAGTA 

AGCCTGGG C AAC AT AG TG AG AC C C CAT C T CTT AAAAAAAAAATTAG C C ATG C ATG ATGG T 

ATGCCTCTAGTCCCAGCTACTTGGGAGGCTGAGGTAGGAGGATCACTTGCTCCCAGGAGG 

TTCAAGGTTCTAAACCAGCAAAGCTCAGAATCCCAGGGGATAGAAACAAAGACTTAGTGG 

ATCACTAGTATTAAACTGAGACACGTCACCCTGCATTGCACTTTGTTTCTCAGTTCTTTG 

ATGAAATCACTGAGCTGACATACCTGCCCTCTTTTCACCATAAAGTGAGTTTCATGATCA 

GAAGCAATGTCTATGGGATAGCCTAACAAACAATGTAAAAACCATTTAGTAAGTTCATGA 

AGGGTGGTGGTGGTAAAAATTTGGAGAACATACAAAACAAATACAATTCCAAGGTGTGTC 

CCCTCCAGGAAGGACAAATTGCTGCCTGCTCTGTGATAGAAGAGGATCAGATGTAATCAA 

CCTGCCGTCAGACTTGGGCTGTTCTCTCCTGGGTGTGGACTTGCCTGGTTGGTCACTGCT 

GCTGACAAGTAGGCTGTCAATATAGCTGGGTTGTCATGTCAGCTGTGGTGAGGGGGAAGT 

CCACATTGTGGAGGCCACATCCCTGCACTCTTGGCCAATTTGACCATGAATCTTAAGCAC 

TGGGGTGGCTGGAAAAGACAGCCGATTGACATCCATACAGAGGTCATCTTGACCACTTGA 

TTAGTATAAGCACTGAAGGCTTTTAACTGAGCATTCACATAGGACACAAATATTCTGATT 

CTTTGGGCCCATTCCAAGAACTCTGGGCATACTTTTCCTCCAGACCTCATACCCAGTTGT 

GTTCTTTCCAAATTTCTGGTCATCTGGTTATGTTATTAGCCACTATCTGTGAATCAGCAT 

AG ATTTTTATAT CAG AC ATCTCT ACC T C CTGAC AG AATGGAGG AG ATATGTT ACTT AAC A 

ATTCTGTTCCCTTGGAAGATTTCCTGTCTCCACTGTTTGTAAGGGCTACTCCCTCAATGT 

AGCAGTAATGCTTTCACTCTGATGGGAAGTCACAGTGGAATTCTGGGTCTCCAAGAATTA 

GTGTTAGTGCATACACAGTGTCTGATAATCCCCAGAGTGTCTGGTGCCCTTGGATCCTGT 

GAAGAAGGCTTGGAGAAAAGAAGATTCATGGCAAGAACTTGTGATGTGATGACAGGGCCT 

TTTCTCTGGCTCTTCATTCTTAGTCTGACCTAGGTGTGAGAATTAGGTCAGGGGCCATGA 

CTATATTGTGGTGACTCAAACCAGGCCTTTGTTTACTAACTGGGAGATTTTTACATTGTA 

AGAATCAAG T AGG AT C TTTG C CCATGT ATTTTGGT C TT AAG AAC AC AAATG AT ATG G CT C 

CAATGACTGGAGGAACACCAGGGTCCTTGGTCTCACGCTGATTTAGATAAAACGACTGTC 

AGGCCTCTGAGCCCAAGCTAAGCCATCCTCCCCTGTGACCTGCACGTATACATCCAGATG 

G CCTGAA G TAA C CAAAGAA TCACAAAAGCAG TGAAAA TGG CCTG TTCCTGCCTTAA CTGA 

TGACATTCCACCATTGTGATTTGTTCCTGCCCCATCTTAACTGAGCGATTAACCTTGTGA 

AATTCCTTCTCCTGGCTCAAAACCTCCCCCACTGAGCACCTTGTGACCCCCGCCCCTGCC 

CCTAA GA GAAAA CCCCCTTTGA TTATAATTTTCCACTA CCCACCCAAA TCCTA TAAAA TG 

GCCCCACCCCTATCTCCCTTCGCTGACTCCTTTTTCGGACTCAGCCCGCCTGCACCCAGG 

TGAAATAAACAGCCTTGTTGCTCACACAAAGCCTGTTTGGTGGACTCTCTTCACACGGAC 
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AAGCTTTAGTAGAGATCTCAAAAATGGTTGGATGGTAGCAAATTACTAAGAACTCTCAAA 
GTTTCTAAAGCCTTAGTTTCAGCTTGCTAGAAAACCTATGTTGAGTATTATGGCTAGTTC 
CATAGTTGAGTTGGGAAATGTCTTTGAGGAGACACTTTTTCACTTTGTATTCATCTGTAC 
ATTTTCTGTTACTTGCATTCTGTCATGCTCAGGCTATTAGAGCAGGTACATTTTTATAAC 
TGGAATGTTTATGTGTAGTGAAGCTCTGAGAGGACTTTGCATTAGATCTCAGCAGCATAA 
TCAGAAGGTTGTCCTTTGTCTCAGCAATTTTTAAGCTAATAGTAGCAGAAATTGCAGTGG 
AAATAGACTGCTTTGCCACAACATTCAGAAAATCATTTATCTTTTTATTGCAGTTCTTGT 
C AC CAAAC AAT A C ATTTTAGT AC TT CT C AAATTG C AG AACT CT C AT AGGG C TGG G AAAA T 
GCCTGTAGACACATACATACTATGAATGTGCTAATGTTTTTTGTATTTTCATAGCCCATC 
AAAGCTCCTGAGTCAGTTTCCACTATAATCACTGCAGAATCAATCTTCTACAAGGTAAGC 
TTTTGTAGAGTTACTGAAGGAAGAGTTGGGCCTAGTGGGTAATGTGCCACTAAAATGTTG 
GATT AG T CT AAAGGT CT C TGCT ACT C TTT ATTTG T AT AAGG TG TG ATT AT ACTTT TTGTT 
CCCTTCTTAGCTGTTTTCCCCCATAAGTGGCTGTTATTAAAACATCTCATCTAGAGCTGA 
AGTGGGAGGAGAAAGTGCCTACTGACACATGATGTGAGGATCTTAAGTATTTTTTTTTAG 
TGTAGATTGTAGGAATTATTCTTAAAATGCTGATTGTATAGTGTGGAGCCATGGAAGACT 
GAGCCGTTAGTGCGATGGCATTGAAGAATGAGAAGGACAGAGACAGGATTTGGACTAGTA 
GAGGTTGTCGACTGTGGTGTCAAATGGGTAGAGTAGGCCCAGAGATTCTAAAATGCCTTT 
AAGTGGAGTTGAGCTGAGTAAGGGCAGTAGTGAGGATTAACACCTACTAGAAATTCATAG 
TGAGAGGAATTCCAAGATGTTTTGATAAAAGAATGAGGAGGTCAGGTTTCCCAGGGCCAA 
AGTCCATGAACATCTGATACCTCAGTGAGAGAAGTGACAGATTGTTGTGTTTAAACCAGA 
AGTCTTAGGAAAGGAATTAGAACATAGACCCCCAAGGCTCGGCAGGCCTGGCACGGCACA 
GGCAGCAACCATTGAAGGCTATTTGGTGTTTCGGGATCTGAACTGTCATTTAGGGGACAG 
TGGTGTGAGTTAGTACTTTATACTTGACCCAGGTGGACTGAGAAACTCAAGTGATGATGC 
C CTTAAG T AT AC TTTTTTTT AAG C C C AC AATCT AT AT AGT C G AAGT CTG TT C CT CC C AAC 
AGGGGTACACTGGCATTCCTCAGCAGGGCTGGGAAAAACCAACAACAAAAAAAGTCTGTA 
CACAGGCAAACATCTCTCTTATTTTTCCAACATTTAATACATTGTTAATAAAATATCTAA 
AGTTTAGCAAACAGTTGCTGTGTATCAGTGGCTGAGCATTTTGCATGCTTTATTTCATTC 
AGTTCACTCTATGAGGTGGATACTACTATCCCCATTTTCTAGATGAGAACATTGAGGCAC 
AGCGAGGTTAATTAACTTGTCCAAGATCACATAGCCAACAAGTCATGGAGTGAGGCAGTC 
TCATGCCAGAGCTTAAGCCTAGAGCATAGTTCCTGGCTCTACAGCTTTAGCAAGTGACTG 
GCTATGTGACGAGGACCAACCTCTCTAATGTCTCATCTGTAAAATAGGAATTGTAAATAG 
TTACTACCTCAGTGGGTCAAATGAAATCATATGTGTTAAGCACTTAGCAGAGTAAGCACT 
CAATGAATAGTAGGAGTTATCACATCTTCGTATTTGTGCATTACCTTCACAGTTTACAGA 
TTAAGGCCAGAAGCAACTTGTTGAGCTACGGGTTTAGTGTACTAACAGTTTCCATGTGTG 
TCTCCATGGAAGGGTGTGTGGGACCTGTTATTGTGACTGTCTGTACTTTCGTATTGTTGT 
CTGCCACCCATGTTTATTAAATGATAAGGACAATAATGCAACAAAGTAGTCAAGTAATGT 
TGCAAATGCCCAGTATTGTAGTGGCTATCACAGCAGTGCCACTGGCAGGCAGCACCATGG 
TGGCAAGTTCAAGAGGTCACTGCCAGCCACTGAGCTAGAGCCCAGATCAGGCATGCAAGA 
GGAGCCTGAGTGGGAGCCACTGGGGATCACGGCCAAGAGTGTGACCACCCAAGACCCAGA 
ATGGCTGAGTGGCCTCCCTGGAGCATGGCAGTGGCAGAACAACTCCATGAACTCAGATCT 
GGTGATGCCTAAACTAGTGCTGTTCTCGTGTGGACCCCTTTTCTCTACCAGAAACCTTGA 
ATCCTCTCAGCAAATGAGGAGACTACTCAGATCAGTGACTTAGTCCTGTTTGGTGTTATA 
TATGTGTACACAACACAGCACATATTAATAAATACCTACTATGTGCCAGGCACTGCCTAC 
CACTGGAATCTTTCACTAAGACATTGTTTTTACTTTGCATTTCTGCCTTTACACTATGAA 
AGTAGATGTTTTGGATTCATATTCATTCAGCATACATTTGAATATGCTGTGTTATGCATA 
GTAAGCCTATGATAAGCAAGTATTCTCATTTAGAATTTGGGAATATTGATTATACATGTG 
GACAAACAAACCATAAATGCAAACTATTTATATGATAAATAACTTTGGACTGATGGCTGG 
GAGGAAGGACCAGCTATTGATGGGTAGGAACTAGCAAGTAGCGGACTGTGGCCTGCATAG 
ACCAGACCCATCCGTAGTGATCCAGATGAAACAGCCACCCTCAGACACTTGGATAAAGGG 
TCCACCAGGAAAAAACTCCTGGCCTATCAGGTGCTATGTTACAGTTCAGTTACTGGAAGT 
ATTTCCTCAAAAGTGTTTTTATGGTTGAGGTACACATTCCTACAGCTTTACCTGCTGCCA 
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AGTCCCTGTTTCAAGGGAAGCAGCAATGAATTACACTGTTCCCGTAGTCAAGGACAGTAT 

ATCTTACCAAGAACTATACCCACTTAAGGAGGTGCTGGATGTCATAAAGATTTGGATCAA 

CCATTATGGGTGTTCAGAGGAGAGATTATTTCCAGCTCAAGACCCAGGGAAGAGGACATA 

GGATGGATACCAGAGTCATAGGGAGGATTTAACACAGGACATGTACACATTAGTTAGTTG 

GGTATAAAGTGGAACAGAAATGAATGAGACACAAAGCCTTGAATGCCAGAAATACTAGTA 

GTCCTGTTGTGGAAGGATATAAAACTCAACTGGGAGTGGAAGAGAAAGGCAGCAGTGAGT 

CTAGGAGATGTACAGTAGGTTGAGGTAAACATATCCTGAAGACTATAATCCAAAGATTAT 

TTTTGGTTTGAATTTGTTTTGGTTTGAATTCATGGTATCTATTTTCTTTGAGTGGATGGT 

TGGGGAGGGTGGCATGTAGAATGCATTCTTACCAAATCAGCATGATTTTCAAGACAGTAC 

AG AGAAAAG ACTG C TG AG CTG ATG TAGGAG C TTTGG CTG C AG TCTCTATGGCTTTCAGCA 

AGC C G TTT AAC CTT A C T ACT GCTT CATG ACTG TGG C T AAC AAAG T AGG G AT AGTACG G AG 

CACAGAGGATTTTTAGGGCGGTGAAACTATTAATACTCTCTTTGTATGATACTATAATGG 

TGGGTACATGTCATTATACATTTGCCCAACCCCACAGAATACACAGCACCAAGAGTGAAC 

CCTAATGTGAACTCTGGTCTTTGATGATGCTATGTCAGTGTACGTTCATCCGTGTAACAA 

GTGTACCACTCTAGTGGTGGGAGGGGTTATTGATAATAGGGGAGGATGTGCATGTGTGGG 

GG C AGG AAG T AT ATGGG AAAT CT CT C TACTT CTG C T C AATTTTG CTGTAAAC CTAAAAC C 

TCTGTAAAAAATAAAGTCTATTTTTTAAAAAGTGGGGATGGTATTACGGCAATATAAAAT 

CAAAATACTTTATGAACAAATCTTTTCTCCAGATGTAAACTGTCATATATGCACCCTCGT 

ATGTG TATG T AT AATTTT CATT C AAAC G TG AAAC AACTTT AG AATTGG C AC CAAAC AT AT 

AAAC ACT G AT AC ATTAG ACTAT CTCGAAC ACCTTTTACT G AC C AC TTT G AAAACTTG CTT 

ACCTATTAAGGTTCATTCATAGCTGTG ATGTTCTATTTTTATTTTCAATGTGGGATTATC 

TTCTGTTTCCCCCAGGGAGTATATTACCAAATTGGTGATGTTGTTTCTGTGATTGATGAA 

CAAGATGGAAAGCCCTACTATGCTCAAATCAGAGGTTTTATCCAGGACCAGTATTGCGAG 

AAGAGTGCAGCACTGACGTGGCTCATTCCTACCCTCTCTAGCCCCAGAGACCAATTTGAT 

CCCGCCTCCTATATCATAG GTAAGTTTGACAAATGGCACAGGTTTTTTTTTAACTTA^TT 

AACTCTCCAATATTATGTAAAAGAGTGTGTTAGTCAGCTTGGGCTGTCAGGACAAAATAT 

CACAGACTGAGTGGCTTAAACAACAGAAAGTCACTTTCTCACAGTTGTGGAGGCTGAAGT 

C CAACAT C AAGG TGCTGGC AAC ACGG ATTT C TG GGG AGGCT TTTCTTCCTGG CAT AT AG A 

TGGTCACCTTCTTGCTGTGTCCTCACATGGCCTTTCATGGAGTGAGAGCTCTTTGGTGTA 

TCTTCTTATAAGGACACCATTTCTGTCAGATGAGGGCCCCACCCTTATGGTTTCATTTAA 

CCTTAATTGCCTCCCTAAAGGTCTCATCTCCAAGTACCATCACATTGGGGATTAGGGCTT 

CAACATATAAATTTGGAGGGTGGCGGGGGGGGATGCAATTCAGTCCATAACAAAAAAAGC 

ATGAGTATTATTAAGTACAAAAAAATTAGAGAGCTTTATAGAAAATATGAGGCATTTTAT 

GTAGCTGGAGTGTGAGTGCTATCAGTTATTTTGAGTTAGAGCAATGTGCATCTACTAAGA 

AG TG G TATGGAT AAGAT TTTTTTGG AGTGAC C CAGGG TTAAACTG T AC TAC AAG AATG TA 

TTGCTCAGGAACTAGGTTATTTAGGTTACTTATTTATACAAACCTATTCAAAAATAATTT 

AGGAAAGAACTATCCCAGTTATCCCATACTTGCAAATTCTCAATATGTGTGCCTCTGCAT 

GCTACACATGTCATCTTAGGCCTTTATAGTATAAAGGCTGATAGTTGAAATGGCAGCTGC 

TGTGCTTTTGTTAATTTCAAAGCTGCCAAAACAGTTGTGAGATAGACTCACAAGAATTTA 

CTGATTAATACAATTTTTAAAGTTTTCAGATTTTTACAGTTACTTCAGACTTTTTATCTT 

TCTGCAGTGAGCATGCATCATTACTTTTGCATCCTGAGAACAAGCATAAGTGTGTTTTTG 

GAGAGAACTC CAGGG ACAAATAATAT AC CACTGTTATTCTC AC CTAT ATGT CAAGTTTGA 

TACATTACCAAACAATTCTAGCCTTCTGCTTATAAGTATATAGAATTTTTATTTACCTTA 

TCTATGGATCAGGATCTCAGCAGAGGCAGTGATGTATCAGAATCACCTTCGGGATTCCTC 

TACTGCCTCCTCTTTCTAATCCCCAGATTCTGATATGCATCCTTGTCCTACAGCGAGGCA 

GCATGGCATGAGGTCAGAACACCAGTTCTGGAGCCAGACTGTCTAGGTTCACAGCCTGCC 

ATTTACCGGCCATGTGACTTTGGCAAGTTTCTTAGTCTCTCTTGCCTCACTTTCCTCATA 

TGTAAAATGGGAATAATAATAGTGCCTACCTCAGAAGGTTGATGTGAGGAATGAAGGTAT 

TGATACATGTAAACTTAGAGCAGTGTGGGTACAAAATAAACATGATGCAAGTGTTCAATC 

ACTG TTTTTGGGAGAATGCCATATTC TTT AAG CCGTT AAAG AAG AAAAAATG ATT AAG AA 

TAATTTCAAAGTAATGCATGTTTCAAGGGCTAATGCCAGGTTGCTCCCAGAGTGGTCTCT 

CCCAGTGTCTAGAAATTTTAACATCTTATGAAAATGATATATATGGTCAAAAATGTATTT 
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AACCTTTCCCTTGGCTGCCTTCCAG GGCCAGAGGAAGATCTTCCAAGGAAGATGGAATAC 

TTGGAATTTGTTTGTCATGCACCTTCTGAGTATTTCAAGTCACGGTCATCACCATTTCCC 

ACAGTTCCCACCAGACCAGAGAAGGGCTACATATGGACTCATGTTGGGCCTACTCCTGCA 

ATAACAATTAAGGAATCAGTTGCCAACCATTTGTAG TTCACAAATTAAAACTnnnTTTrr 

AGGCCTGGTGTGGTGGCTCACGCCTGTAGCCCCAGCTATTGCACCACTGCTCTCCAAGCT 

GGGCAATGGAGTCAGATTCTCTTTCTTAAAAAACCACAAAAAAACTGGATTTCCAGTTCT 

CTAATATTCTTAGTACCACAAGATATGTCATAGGTATCTTTAAATGAAATTCTTAGCTGG 

AAAAGTGACTAAAAAGTTTTTCTCCTGCTACCTAGTAATAAACAAATCATTGTTTATTAC 

TGGTCACTTAGAAAATTAAAAGGGATAGGGCCAGGCACAGTGGCTTATGCCTGTAATTGC 

AGCACTTTTAGAGGCCGAGGCAGGCGGATCACCTGAGGTCGGGAAGTGGATCGCCTGAGG 

TCAGGAGTTCGAGACCAGCCTGGCCAACATGGCGAAACCCCGTCGCTACTAAAAATACAA 

AAATTAGCCAGGTGTGGTGGCATGTGCCTGTAATCCCAGCTATTTGGGAGGCTGAGGCAG 

GAGAATCGCCTAAACCCAGGAGGTGGAGGTTGTAGTGAGCCAAGATTGCACCGCTGTGCT 

CCAGCCTGGGCAACAGAGTGAGACTCTTGTCTCGGAAAAAAAAAAAAAAAAAAAAGGCTG 

GGCACAGTGGCTCACGCCTTTAATCCCAGCACTTTGGGAGGCTGAGGCAGATGGATCGCC 

TGAG G TTGGG AG TT CGAG AC C AGC CT GG C C AG C ATG GTGAAA CCCTGTCTC TAG T AAAAA 

TACAAAAATTAGCCAGGTGTGGTGGCGCACACCTGTAGTCCCAGCTACTCGGGAGGCTGA 

GGCAGGAGAATTGGTTGAACCCAGGAGGCGGAGGTTGCAGTGAGCAGAGATCGTGCCACT 

GCACTCCAGCCTGGGTGGACAGAGCAAGACTCCGTCTCAAAGAAACAAACAAAAAATTAA 

AAGGGATAGAATATAATGAAATATATTTTGAACTTAAATTATATTCTATATGTGTATCTT 

C CT AGG C AAAAG CTGTAATTT C C AG AG AG AC C ATT AG G AA C AGGT AGT ATC TATTT TT CT 

C C ATT ATTT ATTT CT AG AAACT C AT AAAATGG ATTG TATTTTT CT ATAAG AAC AAAAT AT 

TAATTAAGGTATAGATGACTGACCAAGGGCTTAATCAAATAAAATGACTAACAGCATCTA 

TCATAAAGCCACACAAGCCTTATGTTCTCATCTCAAAAATGCTGTGACAGCTTTTTGGCT 

GCTTTAACCATAAGAAAAATGATTGGTGGATGATTTTATTAGCCCAGGCTTTTAAAAACT 

TTCATCTAGGCCACGTGCGGTGGCTCATGCCTGTAATCCCGGCACTTTGGGAGGCCTGAG 

TGGATGGATCACTTGAGGTCAGGAGTTCAGGACCAGCCTGGCCAACATGATGAAACCCTG 

TCTCTACTAAATATACAAAAATTAGTTGGGTGTTATGGTGCATGCCTGTAATCCCAGCTA 

CTCGGGAGGCTGAGGCAGGAGAATTGCTTGAACTCGGGAGGTGGAGATTGCAGTAAGCCG 

AGATCGTGCCACTGCACTCCAGCCTGGGTGATAGAGCAAGACTGTCTCAAAAAAGAAAAA 

AAAGAAAAAATTTTAATTTAATCCTTCTGTAGAAACAGGCATTCAGAACCATTCCATTGA 

TCTTAATAAAGCTGCTCTTTACTGTTTCTAGTCAAAAATGAGACTTCGATCAAACCATAA 

GATTTTATACTGCAGATAGTCAGCTTCACCAAAGCCGCAGAGGAAACATGTCGAGATCAG 

GCTTCCTGCTTGATAGTCTCTTGACTACCATTAAAACGAATATTGGGAGGTCATGAAAGT 

CATTGGTAGGCCATTAGCATTGATATCTTTAAAACATCTACCCTAAACCATCTGCTATGG 

ACCCATAATAAGAGGCCTGTTGTATATGAA ATTGTCTAGAATTCAGGTGCAGGTCTTTGC 

CGGTTAAGTAAGGGAGCAACACGTAAAATGGGAGAGGAGTGGGGTGTACTCACTTGCCTC 

CTCTTTTGTCCTGATTTAACCAGCATTTTTCAACCCTGGGAAAATTTGCAGAATCTAAGT 

TGATTGT AATGATTTTGAGCTGC AG C AG CTTTAACTCTTACC CT TTTTC C AC AT AG TTAT 

GGTGTTTGAGTTGGAAAGAAACAACTATAGGTAGCTACACGTACATAATTATCTCTTTAT 

TCACAAAGGGTATAGTAAAATTGATTGTAAATAACTTTCTAAGTGCCAATATTCAAAACT 

TTTGGATTAAAATGT ATTTTTCACCGTGCATTTACTTTGGATGT ATTT ATTT CATTTAAA 

CAATTTAAATGGGGCTCTTTAACCAAA AATGGTATTTAAAACCAAAACAGTATCGTACTT 

AGAATTTGGAGTAGAGGCCGGGCACAGTGGCTCACGCCTGTAATCCCAGCACTTTGGAAG 

GCTGAGGCAGGCGGATCACCTGAGGTCAGGAGTTCGAGACCAGCCTGGTCAACATGAAAC 

CCCGTCTCTACTAAAAATACAAAAATTAGCTGGGCGTGGTGGCGTGCGCCTATAATCCCA 

GCTAGTCTACTCGGGAGGCTGAGGCAGGAGAATCGCTGGAACTCAGGAGGCAGAGACTGC 

AGTGAGCCGAGATCGCGCCACTGCACTCCAGTCTGGGTGACGGCATGACTCC ATCTCCAA 

AAAAAAAAAAAAAAGATTTTGGAGTAGATTCATCATTAATAAGTAACAGATTTTAGGAAA 

ATCAAAAAATGGCTAATAAAATGAACACAATGTAAAACATTTATTAAAATGTAGACTTTT 

AAAAATCTATAAATTGATCATCTGTTTATAAATTGGCAGATGGTTGTGTACCATCTTTTA 

AAATAAAGATTGAATTTCACCCAGTGTGATGGTTCCCATTGCTTATATTTCTCCTGCTGA 
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GGCCGGACCTGATATGGCCCTGGTCTGTGTTCCCAGCCTTGTTTCCTCATTACCACTAAA 

ATCTTTCCCCTGTATGCCCGCCCAATTTTTCTGGCTCTGAGTCCTTGTTCATACTGTTCT 

CTCCAATTCTACCTTCCAAAGGCCTTTCTTAACACCTTCGGATTCTTTCTTTGAGAACTT 

TCCAGATTCCCATGCCTTTTTGGAATCAATCTCTATCCTATTGTCATCACATTTAAGTTT 

CTACTTCCATCATCCTCACTCCTATCCCTTTGGTCCTGGGATGACAGGGATGCTGTGTTT 

TATTTACTCATCTTTGTAACTTCCACATAACCTAACCCCGGTTCTTGCTTATGGGAGATG 

CTGATTGTAGGGTCTGAGTTAGATACTGTTAACTAAAATGCTTGTTGATATTTTAGTTAT 

T AATTC AT ATTAAC TTTGG C TG AAAC TTTTAAATT C T ATTG TG AAT AG T C AAG T AAAATT 

TAGATTGTTACATTCTGGGTTAGTATTAGATTGTTTTTAAGATTGTTTTAAACAAGATGT 

TTTTAAGATGAGTTTTAAATAGTTCTCTTAACACAAATAAAGCTTAATATGAGTATTTGA 

AGGAAATTATCCCAAACCATTCCAGTTCCTGGCTGTGAAAGGCTTTTCCAGGCCTAATAA 

GTTTTCCACTTCAGCCGTAAGTAGGTG AAATCAAATGAACAATAGAGGGAAATGTATTTA 

TTTGCTTTATACACATGCATGTGTGTTGTGTCTACATATAAACATTGCACACGCTTAGAA 

TGAAGTTTCTGTCATGCCCAGAAAAGGGAGAGGCATTTTTGTGGATTTTGTCTGGCTGCC 

CTGGGGATGTTTGAAGAACTGTGCTGTTTACTTCATACCAGGTGTGTGAGCCATACCTTT 

GGTAGGAGGGTATAC CTCCTACAC CCAAGAAATAT AAGCCAGG AGAAGGTC TGTGC CAAG 

AG AAGGAAC C CAAATGAC C CACAAGAGGTGGG C C ATT AATT ATTGG GT C AG AT G CAT AAA 

TGCACAGTAATTTATTTAAGCACCTCTTAATGGTGACCCACAAGGAAGATTGCTCGTAGT 

AGCGGAAAGGTTCACAATAAATAAGAGAAAAAAG CAGAATGTAGAACTGT ATGATAG CAA 

TTCTGCAAACAAGAAGCATCTTTTATAAAAGATGGAAGGAGCCCAGGCACAGTAGCTCAT 

GCCTGTAATCCCAGCACTTTAAGAGGCTGAGGTGGAGGATCACTTGAGCTGCAGTGACCC 

ATGATTGTGCCACCACTCCAGCCTGGGTGATAGAAGTGAGACCTTCTCTCAAAAAAAAAA 

AAAAAAAAAAAAAGACGGAAATTCCTCCAGAATTTTAACATGTCAACAGAGGTTTTCTGC 

AGCTACTTTTTTCAGCTTTATACTTCGCAGTATTTTCCAAATTTTCTCTAACAAGCAGTA 

TTTTCCAAATTTTTTACAATAAGCACACACACACACACACGTTTGTTTGCATAAGTGCCC 

AACTGGTGGTGAACAACCGCTGGCTTTTAGTCTATACATATCTAGAATATTTTATAAATA 

GTAGTTCTTAAAC CCTTGAAAGGGAGTGAATGACCAG CTGAGAAAATAAAGTC AGTGATT 

TCATTATTTTCCTATATTCACATCATGATTCTAGGAAAGAACTTGGGAGTGACTTCCTTC 

AGCTTCAGCCACTCCTGGGCCAGGCGCATGCTTAGCTCTGTGGTAAAGGTCACCAGCTTC 

TTCTGCAGGGTGCCTGTATCATCTGAATTGGAGGTTTGGCGAGGGTAAGAGACTGATGTA 

GGTTCAAGTTTTTCTTTCCTGTCCTCCACTTGAAATCTGTCTTCCCTTCCAGACTGCCTG 

CGCTGCTGACTTAAGGCCCCAACACCAAACACAGAAGCAACAGCCTTACACAGAGTGTTC 

AGCAAGCTCCAACAATTGTGTAAGGT AAAGTTTCCTTTATAGATTC CTTTT CTATATCG C 

TCCTAGTGGTTCTGTTTCTCTGATCGAATTCTGGCTGATAACAGTTGCTGAGACTCTGAA 

AGAGAAGGCAAGGAACTACTGTTTCTCATTATAAACTGTTTAGAATTATTTGGCCATCTT 

TTTGCTATGAATATGTAGTGCTTTGATACATTTTTTAAATCAAAAAGTAATGAAAGAGAT 

CACATAGGGAAAGATAGATTGGATTATTTTT AAAGTTTATATAC T AAATTG AAAAG C AAA 

GAATAAAATGGGAGAAACAGCTCCCTCATGTGGCTGTTGGCAGGAAGCTTCCATTCCTCT 

CTGTGGGCCTCCACAGGTTTGCTCACAGCAAATGGTCCGTGACAGAAAGACGCAAGGGCA 

GTTGCACCCAAGATGGAAGCCACCATCTTTT CTAT AAC CT AATC TG AAAGAAGGGAC AT A 

CCAGCACTTCTGCCATATGCTGTTGGGTCACACAGACCAACTCTGGTACAGTGTGAACAC 

AGGAC CACACAAGGG CGTGAATTC CAAGGG C AG AG AC CAC TAGGGA CCAC C TCAG AGGCA 

CAGAGGGACACCCTATCCAGCTGGTGGCCAATGTAAATTAACATAGCTTTTTAGAATAGC 

AATATGTAT CT ATAAT CTT AAAAGTATTAAAAGT ACTTCTT GAT C CAG T AATTTC ATTT C 

TAAGAATCCATGCTAAGAGGATTTAAAATGTGGACCAAAAAATGGGTATAAAAAGAAGTT 

GTTAACAGTATTTAAAGTTGTGAAAAACCAGAAACAATCTAAAGGTCCAACAATAGGAAA 

ATGAATTTTGATATTTTTCTAATAGAATTTTATGCTGTCATCAGAAATACCATTTACAAA 

TAATTTTTAATAACGCAAAAAAAAGTTTATAAAATGTTTAGTGTAAAACCTGGACACAAC 

TACATAATGATTCTGATTTTGTAAAAAAAAAAAACAAAAACACACACATATACACATGCA 

TACATATGCATATAAAGAAAACTGGAACAAACAAAATAACAAGCATAGTTGGAATTACAG 

TCATTTTAATATTCTTTATGCTTTTAAAAATTTTGAAGTTTGTATTACTAGCATCCACTA 

CTTACGTAGTCAGGAAAAAAATACAACTTTAAAATAGATATTTAGGTCCAAAGATGGTAA 
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TCTAAATGGTGTTACAGGCTGAATGTGTGCCTGATCCCCATGCCCCAAGTTCATATGTTA 
AAGCCCTGGCCCCCAAGGCAATGGTATTAGGGGAGTAGGGCCTTTGGGAGGTAATCAGAT 
TTCT ACG AGGT C ATG AGG GTGG AG C CCG C AT AGTGG AATT AGTG T C CTTTT AGG AAG AG G 

AGAACAGACCAAAGCCTTCCTTTCTCTCCTCACTATGTAAGAAGACAGCCAGAAGGTGGC 

CACAGCCAGGAAGAGAGCTCTCACCAGAACCCAAATCTGCTAGCACCTTGCTCTTGGGTT 

CTCAGCATCCAGAACTGTGAGAAATGAATGTGTGTTGTTTAAACCACTCAGGCTACGGTA 

TTTTGTTG CAGCAG C C CAAG C TGACAGAG ATAGAAACAAC ACAAGG ACCCATCAGC AGAC 

GAATGGATGATCAAAACGTGGTGAGGTCGTGCAGTGGGATATTATTCAGCCGTAGAAGGA 

ATGAAATTCTGATACATGCTATAATGATGAACCTTGAAAACATGTTAATGGAAATAAGCC 

AAACTTAAAAGGACAAATATTGTATAATTCCACTTATATGAGTTAGTTACCTAGAATAGG 

CAAATTATGTCATAGATACAGAACATTAGAGGTTACCAGGGTTGTGGGAAGAGGGGTATT 

GTGGGTACAAATTTTCGGTTTGGAGTGATTTTGAAAAAATTCTGGAAATGGGTAGTGACA 

GT AG T CAAC ATG ATG AATGT ACTTAATG ACACT AAATTG T AC AC TTAAAAATGG TT AATA 

CTGGGCTGGCGCAGTGGCTCATGGCTGTAAATCCCAGAACTTTGGGAGGCCAAGACAGGC 

GGATCATGAGGTCAGGAGATTGAGACCATTCTGGCTAACATGGTGAAACCCTGTCTCTAC 

TAAAAAATAAAAACAAATAAAAAAAAAATTAGCCGGGCATGGTGGCAGGCACCTGTAGTC 

C C AG CT ACT CGGGAGGCTG AGG C AGG AG AATGG TGTG AC CTGGGAG T CGG AG C TTG C AGT 

GAG C TG AG AT CG CG C C ACTG C ACT C C AG C CT GGG C AAC AG AG C C AG ATT C C G TCTC AAAA 

AAAAAAAAAAAAAGGTTGAT AC CTGGGT G CGG TGG CTCATG C CTG T AATTT C AG C ACTTT 

GGGAGGCCAAGGCAGGCAGATCAGTTGAGGTCAAGAGTTAAGGACCAGCCTGGCCAACGT 

GGCGAAACCCCATCTCTATTAAAAATACAAAAATTAGTCGAGTGTGGTGGTGGGTGCCTG 

TAGTCCCAG CTG CTGGGAGGATGAGGC CTAGGAATTGCTTG AAC CCAGGAGGCAGAGGTT 

GCAGTGAGTTGAGATTGCGCCACTGCACTCCAGCCTGGGGGACAGAGCGAGACTTAGTCT 

CAAAAAAAAGGTTAAAATTGTAAGTTTTGTTATGCATATTTTACCATAATCTTTAAAAAA 

TAGATAT ATAGG AGATAAAGTC AAC AG AATTTAATAAC C AG TTGTAAAT AG AGACTG AGT 

GAGGAGGATGAATTAAGGAAGACATTGAGTACAACTTTTTGGTAGGTGAAAAACTCTTAA 

AAAAATACGTGGGCAAAGATCCTACTTGATTCTTATAATTTAAAAATCTCCCAGTTAGTA 

AACAAGGCTAGGTGGAGATTTGCATGTGATGTGAGGTGTGTGTTCTGTTTTGTAATGTGA 

GGACTGTGAGCCATCTCCTGGACTTGAATATCCATTAGATAATTGAAAATACGGATTTGA 

GAACTCAGGAGACGTGCAATGCAGTAACAAAACTCTGCACCTAGTTGATTTCTGTCTCCT 

AATTT AATGCTTTTATGGGACAAACTGTTAGGC AGG TGGGCAAGATGGACAGCCATATTT 

TTGTGGGTTTCTGGCCTGTGGGCCAGCCTCAGTGCTCACTCTGAGGTCATGTCCAAACTT 

AGAACACATTCAGGCCTACCACAGTCAAGGCTCCCTTTCTCAACTCTAGTCCTCTGCACA 

AATATCCGAAGCCTAGAAATAATAATCATCTGTCCTTGTGTCTTGCATTATGAAAGCCTA 

GGAAAGGGCCTTGGGAATTAAGAAGAATGGAAAAACTGGTCTAACTGCTGCATGCTTCAG 

CTTGCAGGGGAATCACTGAAATGGGGACAGGCCATAAAAGGACAACCAGAAGAGTGGCTT 

CAGCAAAGGCATCGTTTTTCAGAGCAAGCTAGAGAATCCTGCCAGCGTCCTCAGGCAGGG 

CCCCTGGGCACAGAGGTTAGGCAAGGGAGTGTCCCAGCATGTTGATGCCCTGAGCATCAG 

AATAATG C CATAGAGGAGCTT C C AAAGAGTTCATTT C AGGTTTTGTAAGC C G AAC ATTTC 

TAGGCAAATAAAATTTGATTTTGTGAATAAAGCTTGTTTCTTCAACTCCAGTGCAGATTC 

TCATAGATTG AT AGTGG CTTGTGATC CAGATAAAGAAAAC AATTTTT CAAAG ATT CAT AT 

TCTTTGTAGATGTACGG ATTTAG AGAC CATCTAATCT AACT C CCTCATT C T AC AG ATAGG 

AAAAATGAGGCCTAAAGAAGTTAAGAAAATACCATGGAAATGTCACTGCTGAACTGCCAT 

ACGTAGGATCCGAAAGAAATTGGGTAAATGCTACTGTGAGAAATACAGTACTAGGTCCAA 

AGAATCTAATACAAATTAAAAATCTAAATGTTATTTCTAAAGCATCCCTGCACATGGCTG 

AACTTACATAGTTTCATTTTCTTTCTTTTCTGTTGAAGAAGAGGCAATTGGCTGGGTGCA 

GTGGCTCATGCCTGTAATCCTGGCACTTTGAGAGGCCGAGGCGGGTGGATCACCTGAGGT 

CAGGAGTTTGAGACCAGCCTGGCCAACATGGTGAAACCCCATCTCTACTAAAAATACAAA 

AATTAGCTGGCTGTGGTGGCCGCTGCCTGTAATCCCAGCTACTCCAGAGGCTGAGGCAGG 

AGAATTACTTGAATCTGGGAGGTGGAGGTTGCAGTGAGCCAAGATCACGCCATTGCACTC 

TAGCCTGGATGACAAGAGGGAAACTCCATCTCAAAAAAAAAAAGAAAAAAAGCAATCACT 

AACCTGTGTTGTTTATTAAACATGACAGACTGGCATGAAGTAATTACCAAACTGTAAACA 
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AAAAAGCTACAATCTGCCAGGCATGGTGGCTCATGCCTGTAATCCCCCACCTTGGGAGGC 
CAGGTTGGGGGATCACCTGAGGCCTGGAGTTCAAGACTAGCCTGGTCAACATGGTGAAAC 
CTCGTCTCTACTAAAAATACAAAAATTAGCCCGGCGTGGTGGCACATCCCTGTAATCCCA 
GTTACTCAGGAGGCTGAGGCAGGAGAATCACTTGAACCTGGGCAGTGGGGAGGTTGCAGT 
GAGCCAAGATCGCACCGTTGTACTCCAGTCTGGGCCGACAGAGTGAGACTCGGTCTCAAA 
AAAAAG AAAAAAG AAAAG C T AC AAC CTTAAT CT CAACTT C TC AT AAC AT C AT CT C T A CTT 
CTGATTAGAAGAGTGGAAGTGGGGAGGTTTATTACAAAAAGACTGTTATACCTTACACAC 
TTCTCCCCATGAATAGTGAAGGTGTGAGTGAAAAAGACAGCAATTTTATTTTTTTTTTGA 
AACAGGTTCTTGCACTGTCACCCGGGCTGGAGTGCACTGTTGTGATCACTGCTCACTGCA 
GCCTCCACCTCCCAGGCTCAAGTGATCCTCCTACCTCAGCCTCCTGAGTAGCTGGGACCA 
CAGTTGTGCACTACCATGCCCAGCTATTTTTTTTTAAGAGATGGGGTCTCACTATATTGC 
TTAGGCTAGTTCTCAAACTCCTGGCCTCAAGCAGTCCTCCGACCTTGGCCTCCCAAAGGG 
TTGTGATTACAGGCATAAGCCACCACACCCAGCCAGCAGTTTTAGAATAAAGGGTGAAGG 
TGCTGTTGGGGAAATATAATTTAAAAAACAAAATCTTCTCTCAACCCAGAAATCCTCTCC 
ATGAAG G C AG T AG AGAAAG AT AAG CTTT ATT AT TG AATAAAAATT AAATG AG AATGTG AT 
GCACATCACAGGCACTTTGCTAAGAGATCACAAAGACAGAAGGAAATTTCACCATTTTGT 
ACAGCCAAGCAGGTACAGCCCATTACATGTATGTTTTCGAGATAAATAGTCCTCAACTAA 
GAGAACTTGACAGCACCACTGGTCACACAGTTCATTCTAACTTTACCTGATAATTGATGT 
GACCACTTGTGTTATCTAAGATATCAACTTTTCGGGGGTGGGGGAGTGTGGAAACAGGAG 
TTACTTTTATAGCTTGGTGCAAGGTACTCATTAAGATTAGGCTGTTACCCTCCCACAGAA 
ACTGGAAGATAGGTATGCTATCTGGTAATGTTTACATTTCCCAGATCCTTGAGAAAGACA 
TTCCTAGGTCATAAAGCTGACAAAAGGCTGATTCAGTTTTTAAATATATATATCTGTATA 
TGTATTTCA 
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actgagagacaggactagctggatttcctaggctgactaagaatccctaagcctagctgg 

imilllMIIIIIMIIIIIIMM! Mil IIIIIIIIM IIIIMIIIIIIIII 

actgagagacaggactagctggatttcccaggccgactaagaattcctaagcctagctgg 
g-aaggtgaccacatccacctttaaacacggggcttgcaacttagctcacacctgaccaa 

i iiimmiii ii iiiiiiiini i inn mi iiiiiiini mm 

ggaaggtgaccacaccctcccttaaacacagagcttgtaactcagctcacacccgaccaa 
tcag- - agagctcactaaaatgctaattaggc-aaagacaggaggtaaagaaa 

I II I IIIMIIIIMIIII I llllllll.lll IIIIIMIIIIIIIII 

tcaggtagtaaagagagctcactaaaataccaattaggctaaaaacaggaggtaaagaaa 
tagccaa-tcatctattgcctgagagcacagcaggagggacaatgatcgggatataaacc 

II III llllllll llllllllllllll IIIIIIIIIIIIIIIIMIIIIIIIII 

taatcaaatcatctatcgcctgagagcacagggggagggacaatgatcgggatataaacc 
caagtcttcgagccggcaacggcaaccccctttgggtcccctccctttgtatgggagctc 

ii i n inn i ii inn iiiiiiiiiiiiii i iiiiiiiinii! 

caggcatttgagccagatcaggtaaccctctttgggtcccctcacactgtatgggagctc 
tgttttcatgctatttcactctattaaatcttgcaactgcac- -tcttctggtccatgtt 

1 1 II llllllllllllllllllllllllllll IIIMIIIIIIIIIII 

tgtt ttcactctattaaatcttgcaactgcacactcttctggtccatgtt 

tcttacggcttgagctgagctttcgctcgccatccaccactgctgtttgccgccaccgca 

I II Mill IIIMIMIM MIMM MMIMIIMM IIIIMM Ml 

tgttccggctcaagctgagcttttgctcgccgtccaccactgctgaatgccgccattgca 
gacccgccgctgactcccatccctctggatcatgcagggtgtccgctgtgctcctgatcc 

1 1 II Ml Mill Ml Mill Mill MM IMIMIMI IMIIMIM 

gacctgcccttgacttccacccctccggatccggcagagtgtccgctgcactcctgatcc 
agcgaggcacccattgccgctcecaategggctaaaggcttgccattgttcctgcatggc 

IIIIIIIIIIIIIIIIM Mill Ml IIIMIIIIIIIIIIIIMIIIMMI II 

agcgaggcacccattgccactcccgatcaggctaaaggcttgccattgttcctgcacagc 
taagtgcctgggttcatcctaattgagctgaacactagtcactgggttccatggttctct 

IMMMMIMIIIIIIIMM MIIMIMI Ml IMIMIMI IIIIMM 

taagtgcctgggttcatcctaatcaggctgaacactggtcgctgggttccacggttctct 
tctgtgacccacagcttctaatagagctataacactcaccgcatggcccaaggttccatt 

II 1 1 1 1 IIIIIIIIIIIMIIIIIMIIII1IMIII IIIIIIIIIIMIIimi 

tccatgactcacagcttctaatagagctataacactcaccacatggcccaaggttccatt 
cctt-gaatccataaggccaagaaccccaggtcagagaacacgaggcttgccaccatctt 

I II IIIIMM IMMMMMIMMMMIMM I MM III IMIIII 

cgttggaatccatgaggccaagaaccccaggtcagagaataaaaggcccgcc-ccatctt 
gggag 

Mill 

gggag 
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TCCTGTGAAC CTCTAGAGGA TTTGCGCCTG CT CTTCAAAC AACAACCAGC- AGGAAAGTAA 7 6 60 

CTAAAATCAT AAA7CCCCAT GGCCCTCCCT TATCATATTT TTCTCTTTAC TGTTCTTTTA 7 92 0 

CCCTCTTTCA CTCTCACTGC ACCCCCTCCA TGCCGCTGTA TGACCAGTAG CTCCCCTTAC 7 990 

CAAGAGTTTC TATGGAGAAT GCAGCGTCCC GGAAATATTG ATGCCCCATC GTATAGGAGT 804 0 

CTTTCTAAGG GAACCCCCAC CTTCACTGCC CACACCCATA TGCCCCGCAA CTGCTATCAC 8100 

TCTGCCACTC TTTGCATGCA TGCAAATACT CATTATTGGA CAGGAAAAAT GATTAATCCT 8160 

AGTTGTCCTG GAGGACTTGG AGTCACTGTC TGTTGGACTT ACTTCACCCA AACTGGTATG 8220 

TCTGATGGGG GTGGAGTTCA AGATCAGGCA AGAGAAAAAC ATGTAAAAGA AGTAATCTCC 82 90 

CAACTCACCC GGGTACATGG CACCTCTAGC CCCTACAAAG GACTAGA7C? CTCAAAACTA 834 0 

CATGAAACCC TCCGTACCCA TACTCGCCTG GTAAGCCTAT TTAATACCAC CCTCACTGGG 84 00 

CTCCATGAGG TCTCGGCCCA AAACCCTACT AACTGTTGGA TATGCCTCCC CCTGAACTTC 84 50 

AGGCCATATG TTTCAATCCC TGTACCTGAA CAATGGAACA ACTTCAGCAC AGAAATAAAC 8520 

ACCACTTCCG TTTTAGTAGG ACCTCTTGTT TCCAATCTGG AAATAACCCA TACCTCAAAC 8580 

CTCACCTGTG TAAAATTTAG CAATACTACA TACACAACCA ACTCCCAATG CATCAGGTGG 864 0 

GTAACTCCTC CCACACAAAT AGTCTGCCTA CCCTCAGGAA TATTTTT7GT CTGTGGTACC 87 00 

TCAGCCTATC GTTGTTTGAA TGGCTCTTCA GAATCTATGT GCTTCCTCTC ATTCTTAGTG 87 50 

CCCCCTATGA CCATCTACAC TGAACAAGAT TTATACAGTT ATGTCATATC TAAGCCCCGC 8B20 

AACAAAAGAG TACCCATTCT TCCTTTTGTT AT AG GAG C AG GAGTGCTAGG TGCACTAGGT 8880 

ACTGGCATTG GCGGTATCAC AACCTCTACT CAGTTCTACT ACAAACTATC TCAAGAACTA 894 0 

AATGGGGACA TGGAACGGGT CGCCGACTCC CTGGTCACCT TGCAAGATCA ACTTAACTCC 9O0C 

CTAGCAGCAG TAGTCCTTCA AAATCGAAGA GCTTTAGACT TGCTAACCGC TGAAAGAGGG 9060 

GGAACCTGTT TATTTTTAGG GGAAGAATGC TGTTATTATG TTAATCAATC CGGAATCGTC 9120 

ACTGAGAAAG TTAAAGAAAT TCGAGATCGA ATACAACGTA GAG C AG AG G A GCTTCGAAAC 9180 

ACTGGACCCT GGGGCCTCCT CAGCCAATGG ATGCCCTGGA TTCTCCCCTT CTTAGGACCT 924 0 

CTAGCAGCTA TAATATTGCT ACTCCTCTTT GGACCCTGTA TCTTTAACCT CCTTGTTAAC 9300 

TTTGTCTCTT CCAGAATCGA AGCTGTAAAA CTACAAATGG AGCCCAAGAT GCAGTCCAAG 9360 

ACTAAGATCT ACCGCAGACC CCTGGACCGG CCTGCTAGCC CACGATCTGA TGTTAATGAC 94 20 

ATCAAAGGCA CCCCTCCTGA GGAAATCTCA GCTGCACAAC CTCTACTACG CCCCAATTCA 948 0 

GCAGGAAGCA GTTAGAGCGG TCTCGGCCAA CCTCCCCAAC AGCACTTAGG TTTTCCTGTT 954 0 
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AAGCTCCTTCAGGAGAACAAAGAACAGGCCATTACCCTGGAGAAGACTGGCAACTGATTTTACCCACAAGCCCAA 
LysLeuLeuGlnGluAsnLysGluGlnAlalleThrLeuGluLysThrGlyAsn - . . PheTyrProGlnAlaGln 
SerSerPheArgArgThrLysAsnArgProLeuProTrpArgArgLeuAlaThrAspPheThrHisLysProLys 
AlaProSerGlyGluGlnArgThrGlyHisTyrProGlyGluAspTrpGlnLeuIleLeuProThrSerProAsn 



AC CTC AG GG ATTT C AG TAT C T AC TAG T C TGGG TAG ATA CTTTCACGGGTTGGG C AG AG GCCTTCCC CTG T AG G AC 
ThrSerGlylleSerValSerThrSerLeuGlyArgTyrPheHisGlyLeuGlyArgGlyLeuProLeu . . . Asp 
ProGlnGlyPheGlnTyrLeuLeuValTrpValAspThrPheThrGlyTrpAlaGluAlaPheProCysArgThr 
LeuArgAspPheSerlleTyr . . .SerGly. . . IleLeuSerArgValGlyGlnArgProSerProValGlyGln 

AGAAAAGGCCCAAGAGGTAATAAAGGCACTAGTTCATGAAATAATTCCCAGATTCGGACTTCCCCGAGGCTTACA 
ArgLysGlyProArgGlyAsnLysGlyThrSerSer . . . AsnAsnSerGlnlleArgThrSerProArgLeuThr 
GluLysAlaGlnGluVallleLysAlaLeuValHisGluIlelleProArgPheGlyLeuProArgGlyLeuGln 
LysArgProLysArg ArgHis . . . PheMETLys . . . PheProAspSerAspPheProGluAlaTyrArg 

GAGTGACAATAGCCCTGCTTTCCAGGCCACAGTAACCCAGGGAGTATCCCAGGCGTTAGGTATACGATATCACTT 
Glu. . .Gin. . .ProCysPheProGlyHisSerAsnProGlySerlleProGlyValArgTyrThrlleSerLeu 
SerAspAsnSerProAlaPheGlnAlaThrValThrGlnGlyValSerGlnAlaLeuGlylleArgTyrHisLeu 
ValThrlleAlaLeuLeuSerArgProGln. . . ProArgGluTyrProArgArg . . . ValTyrAspIleThrTyr 

ACACTGCGCCTGAAGGCCACAGTCCTCAGGGAAGGTCGAGAAAATGAATGAAACACTCAAAGGACATCTAAAAAA 
ThrLeuArgLeuLysAlaThrValLeuArgGluGlyArgGluAsnGlu , . . AsnThrGlnArgThrSerLysLys 
HisCysAla . . . ArgProGlnSerSerGlyLysValGluLysMETAsnGluThrLeuLysGlyHisLeuLysLys 
ThrAlaProGluGlyHisSerProGlnGIyArgSerArgLys. . . METLysHisSerLysAspIle . . .LysSer 

GCAAACCCAGGAAACCCACCTCACATGGCCTGCTCTGTTGCCTATAGCCTTAAAAAGAATCTGCAACTTTCCCCA 

385 395 405 415 425 435 445 

AlaAsnProGlyAsnProProHisMETAlaCysSerValAlaTyrSerLeuLysLysAsnLeuGlnLeuSerPro 
GlnThrGlnGluThrHisLeuThrTrpProAlaLeuLeuProIleAlaLeuLysArglleCysAsnPheProGln 
LysProArgLysProThrSerHisGlyLeuLeuCysCysLeu. . .Pro. . . LysGluSerAlaThrPheProLys 

AAAAGCAGGACTTAGCCCATACGAAATGCTGTATGGAAGGCCCTTCATAACCAATGACCTTGTGCTTGACCCAAG 
LysSerArgThr . . . ProIleArgAsnAlaValTrpLysAlaLeuHisAsnGln . . .ProCysAla. . . ProLys 
LysAlaGlyLeuSerProTyrGluMETLeuTyrGlyArgProPhelleThrAsnAspLeuValLeuAspProArg 
LysGlnAspLeuAlaHisThrLysCysCysMETGluGlyProSer . . . ProMETThrLeuCysLeuThrGlnAsp 

ACAGCCAACTTAGTTGCAGACATCACCTCCTTAGCCAAATATCAACAAGTTCTTAAAACATTACAAGGAACCTAT 
ThrAlaAsnLeuValAlaAspIleThrSerLeuAlaLysTyrGlnGlnValLeuLysThrLeuGlnGlyThrTyr 
GlnProThr. . . LeuGlnThrSerProPro . . . ProAsnlleAsnLysPheLeuLysHisTyrLysGluProIle 
SerGlnLeuSerCysArgHisHisLeuLeuSerGlnlleSerThrSerSer . . . AsnlleThrArgAsnLeuSer 

CCCTGAGAAGAGGGAAAAGAACTATTCCACCCTTGTGACATGGTATTAGTCAAGTCCCTTCCCTCTAATTCCCCA 
Pro . . ,GluGluGlyLysGluLeuPheHisProCysAspMETValLeuValLysSerLeuProSerAsnSerPro 
ProGluLysArgGluLysAsnTyrSerThrLeuValThrTrpTyr . . . SerSerProPheProLeuIleProHis 
LeuArgArgGlyLysArgThrlleProProLeu. . .HisGlylleSerGlnValProSerLeu . . .PheProIle 

TCCCTAGATACATCCTGGGAAGGACCCTACCCAGTCATTTTATCTACCCCAACTGCGGTTAAAGTGGCTGGAGTG 
SerLeuAspThrSerTrpGluGlyProTyrProVallleLeuSerThrProThrAlaValLysValAlaGlyVal 
Pro . . . IleHisProGlyLysAspProThrGlnSerPheTyrLeuProGlnLeuArgLeuLysTrpLeuGluTrp 
ProArgTyrlleLeuGlyArgThrLeuProSerHisPhelleTyrProAsnCysGly . . . SerGlyTrpSerGly 
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GAGTCTTGGATACATCACACTTGAGTCAAATCCTGGATACTGCCAAAGGAACCTGAAAATCCAGGAGACAACGCT 
GluSerTrpIleHisHisThr . . . ValLysSerTrpIleLeuProLysGluProGluAsnProGlyAspAsnAla 
SerLeuGlyTyrlleThrLeuGluSerAsnProGIyTyrCysGlnArgAsnLeuLysIleGlnGluThrThrLeu 
ValLeuAspThrSerHisLeuSerGlnlleLeuAspThrAlaLysGlyThr . . . LysSerArgArgGlnArg . . . 

AGCTATTCCTGTGAACCTCTAGAGGATTTGCGCCTGCTCTTCAAACAACAACCAGGAGGAAAGTAACTAAAATCA 
SerTyrSerCysGluProLeuGluAspLeuArgLeuLeuPheLysGlnGlnProGlyGlyLys . . . LeuLysSer 
AlalleProValAsnLeu. . . ArglleCysAlaCysSerSerAsnAsnAsnGlnGluGluSerAsn . . .AsnHis 
LeuPheLeu. . . ThrSerArgGlyPheAlaProAlaLeuGlnThrThrThrArgArgLysValThrLysIlelle 

TAAATCCCCATGGCCCTCCCTTATCATATTTTTCTCTTTACTGTTCTTTTACCCTCTTTCACTCTCACTGCACCC 
. . . HeProMETAlaLeuProTvrHisIIePheLeuPheThrValLeuLeuProSerPheThrLeuT hrAlaPro 
LysSerProTrpProSerLeuIlellePhePheSerLeuLeuPhePheTyrProLeuSerLeuSerLeuHisPro 
AsnProHisGlyProProLeuSerTyrPheSerLeuTyrCysSerPheThrLeuPheHisSerHisCysThrPro 

CCTCCATGCCGCTGTATGACCAGTAGCTCCCCTTACCAAGAGTTTCTATGGAGAATGCAGCGTCCCGGAAATATT 
ProProCvsArcrCvsMETThrSerSerSerProTvrGlnGluPheLeuTrpArqMETGlnAr?ProGlvAsnIle 
LeuHisAlaAlaVal . . . ProValAlaProLeuThrLysSerPheTyrGlyGluCysSerValProGluIleLeu 
SerMETProLeuTyrAspGln. . . LeuProLeuProArgValSerMETGluAsnAlaAlaSerArgLysTyr . . . 

GATGCCCCATCGTATAGGAGTCTTTCTAAGGGAACCCCCACCTTCACTGCCCACACCCATATGCCCCGCAACTGC 
AspAlaProSerTvrArqSerLeuSerLvsGlvThrProThrPheThrAlaHisThrHisMETPr oArqAsnCvs 
METProHisArglleGlyValPheLeuArgGluProProProSerLeuProThrProIleCysProAlaThrAla 
CysProIleVal . . .GluSerPhe. . . GlyAsnProHisLeuHisCysProHisProTyrAlaProGlnLeuLeu 

TATCACTCTGCCACTCTTTGCATGCATGCAAATACTCATTATTGGACAGGAAAAATGATTAATCCTAGTTGTCCT 
TvrHisSerAlaThrLeuCvsMETHisAlaAsnThrHisTvrTrpThrGlvLvsMETIleAsnProSerCvsPro 
IleThrLeuProLeuPheAlaCysMETGlnlleLeuIlelleGlyGlnGluLys . . . LeuIleLeuValValLeu 
SerLeuCysHisSerLeuHisAlaCysLysTyrSerLeuLeuAspArgLysAsnAsp. . .Ser. . .LeuSerTrp 

GGAGGACTTGGAGTCACTGTCTGTTGGACTTACTTCACCCAAACTGGTATGTCTGATGGGGGTGGAGTTCAAGAT 
GIvGlvLeuGlvValThrValCvsTrpThrTvrPheThrGlnThrGlvMETSerAspGlvGlvGlvValGlnAsp 
GluAspLeuGluSerLeuSerValGlyLeuThrSerProLysLeuValCysLeuMETGlyValGluPheLysIle 
ArgThrTrpSerHisCysLeuLeuAspLeuLeuHisProAsnTrpTyrVal . . . TrpGlyTrpSerSerArgSer 

CAGGCAAGAGAAAAACATGTAAAAGAAGTAATCTCCCAACTCACCCGGGTACATGGCACCTCTAGCCCCTACAAA 
GlnAlaArqGluLvsHisValLysGluVallleSerGlnLeuThrArqValHisGlvThrSerSerProTvrLvs 
ArgGlnGluLysAsnMET. . . LysLys. . . SerProAsnSerProGlyTyrMETAlaProLeuAlaProThrLys 
GlyLysArgLysThrCysLysArgSerAsnLeuProThrHisProGlyThrTrpHisLeu . . . ProLeuGlnArg 

GG ACT AG ATC TCTCAAAACTAC ATG AAAC C CTC C GT AC C C AT ACT CG C C TGGT AAG C CT ATTT AAT AC C AC CCT C 
GlvLeuAspLeuSerLvsLeuHisGluThrLeuArgThrHisThrArgLeuValSerLeuPheAsnThrThrLeu 
Asp. . . IleSerGlnAsnTyrMETLysProSerValProIleLeuAlaTrp. . . AlaTyrLeuIleProProSer 
ThrArgSerLeuLysThrThr . . . AsnProProTyrProTyrSerProGlyLysProIle . . . TyrHisProHis 

ACTGGGCTCCATGAGGTCTCGGCCCAAAACCCTACTAACTGTTGGATATGCCTCCCCCTGAACTTCAGGCCATAT 
ThrGlvLeuHisGluValSerAlaGlnAsnProThrAsnCvsTrpIIeCvsLeuProLeuAsnPheArgProTvr 
LeuGlySerMETArgSerArgProLysThrLeuLeuThrValGlyTyrAlaSerPro. . . ThrSerGlyHisMET 
TrpAlaPro. . .GlyLeuGlyProLysProTyr . . .LeuLeuAspMETProProProGluLeuGlnAlalleCys 

GTTTCAATCCCTGTACCTGAACAATGGAACAACTTCAGCACAGAAATAAACACCACTTCCGTTTTAGTAGGACCT 
ValSerlleProValProGluGInTrpAsnAsnPheSerThrGluIleAsnThrThrSerValLeuValGlvPro 

PheGlnSerLeuTyrLeuAsriAsnGlyThrThrSerAlaGlnLys . . . ThrProLeuProPhe AspLeu 

PheAsnProCysThr . . . ThrMETGluGlnLeuGlnHisArgAsnLysHisHisPheArgPheSerArgThrSer 
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CTTGTTTCCAATCTGGAAATAACCCATACCTCAAACCTCACCTGTGTAAAATTTAGCAATACTACATACACAACC 
LeuValSerAsnLeuGluIleThrHisThrSerAsnLeuThrCvsValLvsPheSerAsnThrThrTv rThrThr 
LeuPheProIleTrpLys . . . ProIleProGlnThrSerProVal . . . AsnLeuAlalleLeuHisThrGlnPro 
CysPheGlnSerGlyAsnAsnProTyrLeuLysProHisLeuCysLysIle . . . GlnTyrTyrlleHisAsnGln 



AACTCCCAATGCATCAGGTGGGTAACTCCTCCCACACAAATAGTCTGCCTACCCTCAGGAATATTTT7TGTCTGT 
AsnSerGlnCvsIleArcrTrpValThrProProThrGlnlleValCvsLeuProSerGlvIlePhePheValCvs 
ThrProAsnAlaSerGlyGly . . . LeuLeuProHisLys . . . SerAlaTyrProGlnGluTyrPheLeuSerVal 
LeuProMETHisGlnValGlyAsnSerSerHisThrAsnSerLeuProThrLeuArgAsnllePheCysLeuTrp 

GGTACCTCAGCCTATCGTTGTTTGAATGGCTCTTCAGAATCTATGTGCTTCCTCTCATTCTTAGTGCCCCCTATG 
GlvThrSerAlaTyrArcrCvsLeuAsnGlvSerSerGluSerMETCvsPheLeuSerPheLeuValProProMET 
ValProGlnProIleValVal . . .METAlaLeuGlnAsnLeuCysAlaSerSerHisSer . . . CysProLeu. . . 
TyrLeuSerLeuSerLeuPheGluTrpLeuPheArglleTyrValLeuProLeuIleLeuSerAlaProTyrAsp 

ACCATCTACACTGAACAAGATTTATACAGTTATGTCATATCTAAGCCCCGCAACAAAAGAGTACCCATTCTTCCT 
ThrlleTvrThrGluGlnAspLeuTyrSerTvrVallleSerLvsProArqAsnLvsArgValProIleLeuPro 
ProSerThrLeuAsnLysIleTyrThrValMETSerTyrLeuSerProAlaThrLysGluTyrProPhePheLeu 
HisLeuHis. . . ThrArgPhelleGlnLeuCysHisIle . . . AlaProGlnGlnLysSerThrHisSerSerPhe 

TTTGTTATAGGAGCAGGAGTGCTAGGTGCACTAGGTACTGGCATTGGCGGTATCACAACCTCTACTCAGTTCTAC 
PheVallleGlvAlaGlvValLeuGlvAlaLeuGlvThrGlvIleGlvGlvIleThrThrSerThrGlnPheTvr 
LeuLeu. . .GluGlnGluCys . . .ValHis. . . ValLeuAlaLexiAlaValSerGlnProLeuLeuSerSerThr 
CysTyrArgSerArgSerAlaArgCysThrArgTyrTrpHisTrpArgTyrHisAsnLeuTyrSerValLeuLeu 

TACAAACTATCTCAAGAACTAAATGGGGACATGGAACGGGTCGCCGACTCCCTGGTCACCTTGCAAGATCAACTT 
TvrLvsLeuSerGlnGluLeuAsnGlvAspMETGluArcrValAlaAspSerLeuValThrLeuGlnAspGlnLeu 
ThrAsnTyrLeuLys Asn . . . METGlyThrTrpAsnGlyS er ProThr ProTrpS e r ProCys Lys 1 1 eAsnLeu 
GlnThrlleSerArgThrLysTrpGlyHisGlyThrGlyArgArgLeuProGlyHisLeuAlaArgSerThr . . . 

AACTCCCTAGCAGCAGTAGTCCTTCAAAATCGAAGAGCTTTAGACTTGC7AACCGCTGAAAGAGGGGGAACCTGT 
AsnSerLeuAlaAlaValValLeuGlnAsnArqArgAlaLeuAspLeuLeuThrAlaGluArqGlvGlvThrCvs 
ThrPro. . .GlnGln. . . SerPheLysIleGluGluLeu . . .ThrCys. . . ProLeuLysGluGlyGluProVal 
LeuProSerSerSerSerProSerLysSerLysSerPheArgLeuAlaAsnArg . . . LysArgGlyAsriLeuPhe 

TTATTTTTAGGGGAAGAATGCTGTTATTATGTTAATCAATCCGGAATCGTCACTGAGAAAGTTAAAGAAATTCGA 
LeuPheLeuGlvGluGluCvsCvsTvrTvrValAsnGlnSerGlvIleValThrGiuLvsValLvsGluIleArg 
TyrPhe . . . GlyLysAsnAlaVallleMETLeuIleAsnProGluSerSerLeuArgLysLeuLysLysPheGlu 
IlePheArgGlyArgMETLeuLeuLeuCys . . . SerlleArgAsnArgHis . . . GluSer. . . ArgAsnSerArg 

GATCGAATACAACGTAGAGCAGAGGAGCTTCGAAACACTGGACCCTGGGGCCTCCTCAGCCAATGGATGCCCTGG 
AspArqlleGlaArqArqAlaGluGluLeuArqAsnThrGlvProTrpGlvLeuLeuSerGlnTrpMETProTrp 
IleGluTyrAsnValGluGlnArgSerPheGluThrLeuAspProGlyAlaSerSerAlaAsnGlyCysProGly 
SerAsnThrThr . . . SerArgGlyAlaSerLysHisTrpThrLeuGlyProProGlnProMETAspAlaLeuAsp 

ATTCTCCCCTTCTTAGGACCTCTAGCAGCTATAATATTGCTACTCCTCTTTGGACCCTGTATCTTTAACCTCCTT 
IleLeuProPhelieuGlvProLeuAlaAlallelleLeuLeuLeuLeuPheGlyProCvsIlePheAsnLeuLeu 
' PheSerProSer . . .AspLeu. . .GlnLeu. . .TyrCysTyrSerSerLeuAspProValSerLeuThrSerLeu 
SerProLeuLeuArgThrSerSerSerTyrAsnlleAlaThrProLeuTrpThrLeuTyrLeu . . . ProProCys 
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GTTAACTTTGTCTCTTCCAGAATCGAAGCTGTAAAACTACAAATGGAGCCCAAGATGCAGTCCAAGACTAAGATC 
ValAsnPheValSerSerArglleGIuAlaValLvsLeuGlnMETGluProLysMETGlnSerLvsThrLvsIle 
LeuThrLeuSerLeuProGluSerLysLeu . . . AsnTyrLysTrpSerProArgCysSerProArgLeuArgSer 
. . .LeuCysLeuPheGlnAsnArgSerCysLysThrThrAsnGlyAlaGlnAspAlaValGInAsp. . .AspLeu 

TACCGCAGACCCCTGGACCGGCCTGCTAGCCCACGATCTGATGTTAATGACATCAAAGGCACCCCTCCTGAGGAA 
TyrArgArgProLeuAspArgProAlaSerProArgSerAspValAsnAspIleLvsGlvThrProProGIuGlu 
ThrAlaAspProTrpThrGlyLeuLeuAlaHisAspLeuMETLeuMETThrSerLysAlaProLeuLeuArgLys 
ProGlnThrProGlyProAlaCys . . . ProThrlle. . . Cys HisGlnArgHisProSer . . .GlyAsn 



AT CT C AG C TGC AC AAC CT CTA CT ACG CC C C AAT T C AG C AG G AAG C AG TT AG AG CGG TCG T C GG C C AAC CT C C C C A 
IleSerAlaAlaGInProLeuLeuArgProAsnSerAlaGlySerSer . . . SerGlyArgArgProThrSerPro 
SerGlnLeuHisAsnLeuTyrTyrAlaProIleGlnGlnGluAlaValArgAlaValValGlyGlnProProGln 
LeuSerCysThrThrSerThrThrProGlnPheSerArgLysGlnLeuGluArgSerSerAlaAsnLeuProAsn 

ACAGCACTTAGGTTTTCCTGTTGAGATGGGGG 
ThrAlaLeuArgPheSerCys . . . AspGlyGly 
GlnHisLeuGlyPheProValGluMETGly 
SerThr. . . ValPheLeuLeuArgTrpGly 
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LysLeuLeuGlnGluAsnLysGluGlnAlalleThrLeuGluLysThrGlyAsn . . . PheTyrProGlr.AlaGir. 
ThrSerGlylleSerValSerThrSerLeuGlyArgTyrPheHisGlyLeuGIyArgGlyLeuProLe- . - .Asp 
ArgLysGlyProArgGlyAsnLysGlyThrSerSer . . . AsnAsnSerGlnl leArgThrSerProArgLeuThr 
Glu. . .Gin. . .ProCysPheProGlyHisSerAsnProGIySerlieProGlyValArgTyrThrlleSerLeu 
ThrLeuArgLeuLysAlaThrValLeuArgGluGlyArgGiuAsnGlu . . . AsnThrGlnArgThrSerLysLys 

AlaAsnProGlyAsnProProHisMETAlaCysSerValAlaTyrSerLeuLysLysAsnLeuGlnLeuSerPrc 
LysSerArgThr . . . ProIleArgAsnAlaValTrpLysAlaLeuHisAsnGln . . . ProCysAla . . . ProLys 
ThrAlaAsnLeuValAlaAspIieThrSerLeuAlaLysTyrGlnGlnValLeuLysThrLeuGlnG-yThrTyr 
Pro . . . GluGluGlyLysGluLeuPheHisProCysAspMETValLeuValLysSerLeuProSerAsnSerPro 
SerLeuAspThrSerTrpGluGIyProTyrProVallleLeuSerThrProThrAlaValLysValAlaGiyVal 
GluSerTrpIleHisHisThr . . . ValLysSerTrpIleLeuProLysGluProGluAsnProGlyAspAsnAla 
SerTyrSerCysGluProLeuGluAspLeuArgLeuLeuPheLysGlnGlnProGlyGlyLys . . . LeuLysSer 
. . . IleProMETAlaLeuProTyrHisIlePheLeuPheThrValLeuLeuPrcSerPheThrLeuThrAiaPro 
ProProCysArgCysMETThrSerSerSerProTyrGlnGluPheLeuTrpArgMETGlnArgProGlyAsnlle 
AspAlaProSerTyrArgSerLeuSerLysGlyThrProThrPheThrAlaHisThrHisMETProArgAsnCys 
TyrHisSerAlaThrLeuCysMETHisAlaAsnThrHisTyrTrpThrGlyLysMETIleAsnProSerCysPro 
GlyGlyLeuGlyValThrValCysTrpThrTyrPheThrGlnThrGlyMETSerAspGlyGlyGlyValGlnAsp 
GlnAlaArgGluLysHisValLysGluVallleSerGlnLeuThrArgvalHisGlyThrSerSerProTyrLys 
GlyLeuAspLeuSerLysLeuHisGluThrLeuArgThrHisThrArgLeuValSerLeuPheAsnThrThrLeu 
ThrGlyLeuHisGluValSerAlaGlnAsnProThrAsnCysTrpIleCysLeuProLeuAsnPheArgProTyr 
ValSerlleProValProGluGlnTrpAsnAsnPheSerThrGluIleAsnThrThrSerValLeuVaiGlyPro 
LeuValSerAsnLeuGluIleThrHisThrSerAsnLeuThrCysValLysPheSerAsnThrThrTyrThrThr 
AsnSerGlnCysIleArgTrpValThrProProThrGlnlleValCysLeuProSerGlyllePhePheValCys 
GlyThrSerAlaTyrArgCysLeuAsnGlySerSerGluSerMETCysPheLeuSerPheLeuValProProMET 
ThrlleTyrThrGluGlnAspLeuTyrSerTyrVallleSerLysProArgAsnLysArgValProIleLeuPro 
PheVallleGlyAlaGlyValLeuGlyAlaLeuGlyThrGlylleGlyGlylleThrThrSerThrGlnPheTyr 
TyrLysLeuSerGlnGluLeuAsnGlyAspMETGluArgValAlaAspSerLeuValThrLeuGlnAspGinLeu 
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AsnSerLeuAlaAlaValValLeuGinAsnArgArgAlaLeuAspLeuLeuThrAIaGluArgGlyGiyThrCys 
LeuPheLeuGlyGluGluCysCysTyrTyrValAsnGlr.SerGlylleValThrGluLysValLysGIuIieArg 
AspArglleGlnArgArgAlaGluGluLeuArgAsnThrGlyProTrpGlyLeuLeuSerGlnTrpMETPrcTrc 
IleLeuProPheLeuGlyProLeuAlaAlallelleLeuLeuLeuLeuPheGlyProCysIlePheAsnLeuIiei: 
ValAsnPheValSerSerArglleGluAiaValLysLeuGlnMETGluProLysMETGlnSerLysThrLysIle 
TyrArgArgProLeuAspArgProAlaSerProArgSerAspValAsnAspIIeLysGlyThrProProGluGlu 
IleSerAlaAlaGlnProLeuLeuArgProAsnSerAlaGlySerSer . . . SerGIyArgArgProThrSer Pro 
ThrAlaLeuArgPheSerCys . . .AspGiyGly 

FIGURE 19.2 
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SerSerPheArgArgThrLysAsnArgProLeuProTrpArgArgLeuAlaThrAspPheTnrhisLysProLys 
ProGlnGlyPheGlnTyrLeuLeuValTrpVaiAspThr?heThrGlyTrpAlaGiuAla?he?roCysArgThr 
GluLysAlaGlnGluVallleLysAlaLeuVaiHisGluIlelleProArgPheGlyLeuProArgGlyLeuGln 
SerAspAsnSerProAlaPheGlnAlaThrVaiThrGlnGlyValSerGInAlcLeuGlylleArgTyrKisLeu 
HisCysAla. . . ArgProGlnSerSerGlyLysValGluLysMETAsr.GIuThrLeuLysGlyHisLeuLysLys 
GlnThrGlnGluThrHisLeuThrTrpProAlaLeuLeuFrorieAlaLeuLysArglleCysAsnPheProGIn 
LysAlaGlyLeuSerProTyrGluMETLeuTyrGlyArgProPhelleThrAsnAspLeuValLeuAspProArg 
GlnProThr. . . LeuGlnThrSerProPro . . . ProAsnlleAsnLysPheLeuLysHisTyrLysGluProIle 
ProGluLysArgGluLysAsnTyrSerThrLeuValThrTrpTyr . . . SerSerProPheProLeuIleProHis 
Pro. . . IieHisProGlyLysAspProThrGlnSerPheTyrLeuFroGlnLeuArgLeuLysTrpLeuGluTrp 
SerLeuGlyTyrlleThrLeuGIuSerAsnProGlyTyrCysGlnArgAsnLeuLysIleGlnGluThrThrLeu 
AlalleProValAsnLeu. . . ArglleCysAlaCysSerSerAsnAsnAsnGlnGluGluSerAsn . . .AsnHis 
LysSerProTrpPrcSerLeuIlellePhePheSerLeuLeuPhePheTyrProLeuSerLeuSerLeuHisPro 
LeuHisAlaAIaVal . . . ProValAlaProLeuThrLysSerPheTyrGlyGluCysSerValProGluIleLeu 
HETProHisArglleGlyValPheLeuArgGluProProProSerLeuProThrProIleCysProAlaThrAla 
IleThrLeuProLeuPheAlaCysMETGlnlleLeuIlelleGlyGlnGluLys . . . LeuIleLeuVal ValLeu 
GluAspLeuGluSerLeuSerValGlyLeuThrSerProLysLeuValCysLeuMETGlyValGluPheLysIle 
ArgGlnGluLysAsnMET . . .LysLys. . . Ser ProAsnSer ProGlyTyrMETAlaProLeuAlaProThrLys 
Asp. . . IleSerGinAsnTyrMETLysProSerValProIleLeuAlaTrp. , . AiaTyrLeuIleProProSer 
LeuGlySerMETArgSerArgProLysThrLeuLeuThrValGlyTyrAlaSerPro . . . ThrSerGlyHisMET 

PheGlnSerLeuTyrLeuAsnAsnGlyThrThrSerAlaGlnLys . . . ThrProLeuProPhe AspLeu 

LeuPheProIleTrpLys . . . ProIleProGlnThrSerProVal . . . AsnLeuAlalleLeuKisThrGlnPro 
ThrProAsnAIaSerGlyGly. . . LeuLeuProHisLys . . . SerAlaTyrProGlnGluTyrPheLeuSerVal 
ValProGlnProIleValVal. . . METAlaLeuGlnAsnLeuCysAlaSerSerHisSer . . .CysProLeu. . . 
ProSerThrLeuAsnLysIleTyrThrValMETSerTyrLeuSerProAlaThrLysGluTyrProPhePheLeu 
LeuLeu. . . GluGlnGluCys . . .ValHis. . . ValLeuAlaLeuAlaValSerGlnProLeuLeuSerSerThr 
ThrAsnTyrLeuLysAsn. . . METGIyThrTrpAsnGlySerProThr ProTrpSerProCysLys lieAsnLeu 
ThrPro. . .GlnGln. . . SerPheLysIleGluGluLeu . . . ThrCys . . . ProLeuLysGluGlyGluProVal 
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TyrPhe . . .GlyLysAsnAlaVallleMETLeuIleAsr.ProGiuSerSerLeuArgLysLeuLysLysFr.eGIu 
IleGluTyrAsnValGluGlnArgSerPheGluThrLeuAspProGlyAlaSerSerAlaAsnGlyCysFroGly 
PheSerProSer . . .AspLeu. . .GlnLeu. . . TyrCysTyrSerSerLeuAscProVaiSerleuTnrSerLeu 
LeuThrLeuSerLeuProGluSerLysLeu . . . AsnTyrLysTrpSerFroArgCysSerProArgleuArgSer 
ThrAlaAspProTrpThrGlyLeuLeuAiaHisAspLeuMETLeuMETThrSerLysAlaPrcLeuLeuArgLys 
SerGlnLeuHisAsnLeuTyrTyrAlaProIieGinGlnGluAlaValArgAlaValValGlyGlnrroProGin 
GlnHisLeuGlyPheProValGluMETGly 
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AlaProSerGlyGluGlnArgThrGlyHisTyr?roGlyGluAspTrpGlnLeuIleLeu?roTr.rSer?rcAsn 
LeuArgAspPheSerlleTyr . . .SerGly. . . I leLeuSerArgValGlyGlnArgProSer ProValGiyGln 

LysArgProLysArg ArgHis. . . PheMETLys . . . PheProAspSerAspPheProGiuAlaTyrArg 

ValThrlleAlaLeuLeuSerArgProGln. . . ProArgGluTyrProArgArg . . . ValTyrAspIleThrTyr 
ThrAlaProGluGlyHisSerProGlnGlyArgSerArgLys . . . METLysHisSerLysAspIIe . . .LysSer 
LysProArgLysProThrSerHisGlyLeuLeuCysCysLeu. . .Pre. . . LysGluSerAlaThr PheProLys 
LysGlnAspLeuAlaHisThrLysCysCysMETGluGlyProSer . . . ProMETThrLeuCysLeuThrGlr.Asp 
SerGlnLeuSerCysArgHisHisLeuLeuSerGlnlleSerThrSerSer . . . Asr.IleThrArgAsnLeuSer 
LeuArgArcGlyLysArgThrlleProProLeu. . . HisGlylleSerGinValProSerLeu . . . PheProIle 
ProArgTyrlleLeuGlyArgThrLeuProSerHisPhelleTyrProAsnCysGly . . . SerGiyTrpSerGly 
ValLeuAspThrSerHisLeuSerGlnlleLeuAspThrAlaLysGlyThr . . . LysSerArgArgGlnArg . . . 
LeuPheLeu. . . ThrSerArgGlyPheAlaProAlaLeuGlnThrThrThrArgArgLysValThrLysIielle 
AsnProKisGlyProProLeuSerTyrPheSerLeuTyrCysSerPheThrLeuPheHisSerKisCysThrPro 
SerMETProLeuTyrAspGln. . . LeuProLeuProArgValSerMETGluAsnAlaAlaSerArgLysTyr . . . 
CysProIleVal . . .GluSerPhe. . . GlyAsnProHisLeuHisCysProHisProTyrAlaProGlnLeuLeu 
SerLeuCysHisSerLeuHisAlaCysLysTyrSerLeuLeuAspArgLysAsnAsp. . .Ser. . . LeuSerTrp 
ArgThrTrpSerHisCysLeuLeuAspLeuLeuHisProAsnTrpTyrVal . . . TrpGlyTrpSerSerArgSer 
GlyLysArgLysThrCysLysArgSerAsnLeuProThrHisProGlyThrTrpHisLeu . . . ProLeuGInArg 
ThrArgSerLeuLysThrThr. . . AsnProProTyrProTyrSerProGlyLysProIle. . . TyrHisProHis 
TrpAlaPro. . . GlyLeuGlyProLysProTyr . . . LeuLeuAspMETProProProGluLeuGlnAlalleCys 
PheAsnProCysThr . . . ThrMETGluGlnLeuGlnHisArgAsnLysHisHisPheArgPheSerArgThrSer 
CysPheGlnSerGlyAsnAsnProTyrLeuLysProHisLeuCysLysIle. . . GlnTyrTyrlleHisAsnGln 
LeuProMETHisGlnValGlyAsnSerSerHisThrAsnSerLeuProThrLeuArgAsnllePheCysLeuTrp 
TyrLeuSerLeuSerLeuPheGluTrpLeuPheArglleTyrValLeuProLeuIieLeuSerAlaProTyrAsp 
HisLeuHis. . . ThrArgPhelleGlnLeuCysHisIle . . . AlaProGlnGlnLysSerThrHisSerSer Phe 
CysTyrArgSerArgSerAlaArgCysThrArgTyrTrpHisTrpArgTyrHisAsnLeuTyrSerValLeuLeu 
GlnThrlleSerArgThrLysTrpGlyHisGlyThrGlyArgArgLeuProGlyHisLeuAlaArgSerThr . . . 
LeuProSerSerSerSerProSerLysSerLysSerPheArgLeuAlaAsnArg . . . LysArgGlyAsnLeuPhe 
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IlePheArgGlyArgMETLeuLeuLeuCys . . . SerlleArgAsnArgHis . . .GiuSer. . . ArgAsnSerArc 
SerAsnThrThr . . . SerArgGl yAlaSerLysHisTrpThrLeuGlyProProGinProMETAspAiaLeuAsp 
SerProLeuLeuArgThrSerSerSerTyrAsnlleAiaThrProLGuTrpThrLeuTyrLeu . . . FroPrcCys 
. . . LeuCysLeuPheGlnAsnArgSerCysLysThrThrAsnGIyAlaGlnAspAIaValGlnAsp . . .AspLeu 

ProGlnThrProGlyProAIaCys . . . ProThrlle. . -Cys HisGlnArgHisProSer . . .GlyAsn 

LeuSerCysThrThrSerThrThrProGlnPheSerArgLysGlnLeuGluArgSerSerAlaAsnLeuPrcAsr. 
SerThr. . . ValPheLeuLeuArgTrpGiy 

FIGURE 21.2 
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CTr,CTACAGCACGGGCTTCTAAAACCTATAAACTCTCCATACAATTCCCCCATTTTACCT 

GTCTAAAAACCAGATAAGTCTTACAGGTTAGTTCAGAATC TGCACCTTATCAACCAAATT 

flTTTTGCCTATCCACCCTGTAGCACCCAACTCGTACACTCTTTTGTCC TCAATGCCTTCC 

CCCACAACTCACTATTCCGTTCTTGATCTTAAAGATGCTTTTTTCACTATTCCCCTGCAC 

CCCTCATCCCAGCCTCTCTTTGCTTTTACCTGGACTGACCCTGACA CCCATCAGTCCCAG 

CAGCTTACCTGGGCTGTACTGCCGCAAGGCTTCAGGGACAGCCCTCATTACTTCAGCCAA 

GCTCTTTCTCATGATTTACTTTCTTTCCACCTCTCTGCT TCTCACCTTATTCAATATATT 

GATGACCTTCTACTTTGTAGCCCCTCCTTTAAATCTTCTC AACAAGACACCCTCCTGCTC 

CTTCAACATTTGTTCTCCAAAGGATATCGGGTATCCCCCTCCAAAGCTCAAATTTCTTCT 

CCATCTGTTACATACCTCGGCATAATTCTTCATGAAAACACATGTGCTCTCCCTGCCAAT 

TGCGTCTCCAACTGATCTCTCAAATCCCAACCTCTTCTAC AAAACAACAACTCCTTTCCC 

TCCTAGGCATGGTTGGATACTTTTGCCTTTGGATACCT GGTTTTGCCATCCTAACAAAAT 

CATTATATAAACTCACAAAAGGAAACCTAGCTGACCCCATAGATTCTA AATCCTTTCCCC 

ACTCCTCTTTCCATTCCTTGAAGACAGCTTTAGAGACTGCTCCCACACTAGCTCTCCCTG 

TCTCATCCCAACCCTTTTCATTACACACAGCCGAAGTGCAGGGCTG TGCAGTCGGAATTC 

TTACACAAGGACCGGGACCATGGCCTGTAGCCTTTTTGTCC AAACAACTTGACCTTACTG 

TTTTAGGCTCGCCATCATGTCTCCATGCGGTAGCTTCC GCTGCCCTAATACTTTTAGAGG 

CCCTCAAAATCACAAACTATGCTCAACTGACTCTCTACAGCTCTCACAACTTCCAAAATC 

TATTTTCTTTCTCACACCTGACGCATATACTTTCTGCT CCCCGGCTCCTTCAGCTGTATT 

CACTCTTTGTTGAGTCTCCCACAATTACCATTCTTCCTGG CCCAGACTTCAATCTGGCCT 

CCCACATTATTCTGGATACCACACCTGACCCTGATGATTGTATGTC TCTGATCTACCTGA 

CATTCACCCCATTTCCCCATATTTCCTTCTTTTCTGTTCCTCATGT TGATCACATTTGGT 

TTACTGACGGCAGTTCCACCAGGCCTGATCGCCACTCA CCAGCAAAGGCAGGCTATGCTA 

TAGAATCTTCCACATCCATCATTGAGGCTAC TGCTCTGCCCCCCTCCACTACCTCTCAGC 

AAGCCGAACTGATTGCCTTAACTCGGGCCTTCACTCTTGC AAAGGGACTACACGTCAATA 

TTTATACTGACTCTAAATATGCCTTCCATATCTTGCACCACCATGC TGTTATATGGGCTG 

AAAGAGGTTTCCTCACTACGCAAGGGTCCTCCATCATT AATGCCTCTTTAATAAAAACTC 

TTCTCAAGGCTGCTTTACTTCCAAAGGAAGCTGGAGTC ACACACTGCAAGGGCCACCAAA 

AGGCGTCAGATCCCATTACTCTAGGAAATGCTTATGCTGA TAAGGTAGCTAAAGAAGCAC 

CTAGCGTTCCAACTTCTGTCCCTCATGGCCAGTTTTTCTCC TTCCCATCAGTCATTCCCA 

CCTACTCCCCCATTGAAACTTCCGCCTATCAATCTCTTCTC ACACAAGGCAAATGGTTCT 

TAGACCAAGGAAAATATCTCCTTCCAGCCTr JVCAGGCCCATTCTATTCTGTCATCATTTC 

ATAACCTCTTCCATGTAGGTTACAAGCCACTAGTCCACCTCTTAGA ACCTCTCATTTCCT 

TCCATCGTGGAAACATATCCTCAAGGAAATCACTTCTCAG TGTTCCATCTGCTATTCTAC 

TACCCCTCAGGGATTGTTCAGGCCCCCTCCCCTCCCTAC ACATCAAGCTCGGGGATTTGC 

CCCTGCCCAGGACTGGCAAATTGACTTTACTCACATGCCCTGAG TCAGGAAACTAAAATA 

CCTCTTGGTCTGGGTAGACACTGTCACTGGATGGGTAGAGGCCTTT CCCACAGGGTCTGA 

GAAGGCCACTGCAGTCATTTCTTCCCTTCTGTCAGACA TAATTCCTTGGGTTGGCCTTCC 

CACCTCTATACAGTCCAATAACGGAGCAGCGTTTATTAGTC AAATCACCTGAGCAGTTTT 

TCAGGCTCTTGGTATTCAGTGGAACCTTCGTACCCCTTACTGTCCT GAATCTTCAGGAAA 

GGTAGAATGGACTAATGGTCTTTTAAAAAC ACACCCCACCAAACTCAGCCTCCAACTTAA 

AAAGGAGGATAGAGCCCAAAAACTCGCAAC C AAGCT AGT AATTATGCTGAACCCC CTTGG 

GCACTCTCTAATTGGATGTCTTAGGTCCTCCCAAATCTTAG TCCTTTAATATCTGTTTTT 

CTCCTTCTCTTATTCGGACCTTGTGTCTTCCGTTTAGTTTTTCA ATTCATACAAAACCGC 

ATCCAGGCCATCACCAATCGTTCTATACAATAAATGCTCCTTCTAACAACCCCACAA TAT 

CGCCCCTTACCACAAAATCTTCCTTCAGCTTAATCTCT CCCACTCTAGGTTCCCATGCCG 

CCCATAATCCCTCTCGAAGCAGCCCTGAGAAACATAGCCCATTATCTCTCCATACCACCC 

CCAAAATTTTTGCTGCCCCAACACTTCAACACTATTTTACATTATTT TTCTTATTAATAT 
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AAGAAGACAGCAATGTCAGGCCTCTGAGCCCAAGCCATCATATCCCCTGTGACCTGCACA 
TATACATCCAGATGGCCTGAAGTAACTGAAGAATCACAAAAGAAGTGAAAATGGCCTGTT 
CCTGCCTTAACCGATGACATTCCACCACTGTGATTTGTTCCTGCCCCACCTTAACTGAGC 
AATTAACCTTGGGAAATTCCTTCTCCTGGCTCAAAACCTCCCCCACTGAGCACCTTGTGA 
CCCCTGCCCCTCCACTACCCACCCAAATCCTATAAAATGGCCCCACCCCATCTCCCTTAG 
CTGACTCCTTTTTTGGACTCAGCCCGCCTGCACCCAGGTGAAATAAACAGCCTTGTTGCT 
CACACAAAGCCTGTTTGGTGGACTCTCTTCACAGGGAC GGGGGTGACAACAACACGGACA 
CACATGGAGTGGTTTTAAGGAGCAGAGAGTTTAATACGCAAAAAAGAAGGAAGAGGCTCC 
CCTGTACAGACACAGAGGGAGGGGGCTCCAAGCCGAGAGAAGGAAACCCCATGTGCAGTG 
GAAAAGTGGTTGATTATACTGGGAGGCTGGAGGAGGCGGTGTCTGATTTGCACAGGGCCC 
AGGGGATTGGGTTGACCAGGTGTATCATTCATGTACCCCGCAAAAAACCTGGCCCTCCCA 
CCTCAGCCCTTTAATATGCAAATGTGGGTTGCCATGATGTTCTGAAAACACATGAATTAT 
CTGGAGGGGGCCATGACACTTGGTACATGTGCTGACAAGAAGAGGGTGGGAATCGCCATG 
GTGGCCATGTTGGGTGGACCTAGTTTTTAATAGCCTGCATTTGCATATCAAAGTTTGCTG 
GCCTGGCTCTTTAAGCTGTCTTTTCTGTTAGAAAAGGAATGGTTTGGAATGGGTGAGGGT 
TGCTTCTTATTACAAGAAAATTTCCAAAAACCTTTACTCTTTCTAGCTGCCAAAAAACTA 
TTTCTTAATAACTTATGTATTACCATAATTAGGCAGCACCAAAGATCCCTGCAGGTCAGA 
CCACTGCAATTAACATGCTGGCTTTACTGCTGATTATGGTAGCTGCATCCACCTAGCCTC 
TCATATTGCAACTGCCTGACCTCTGCCACCCCACGAGCCACTTATCCCCACTTATAATCA 
GCCCATTTCGATTGTAACATCTGCCACTTATTCCCGACGTTGTGGTATATCCTATAGATG 
AATTCATTCAACATCCATTCCAACACCACCTCTCTTGCCTTCCTATACTCTCTGGAGAGT 
GAATTACTGAGTCACATGATCTTCACTGCAGTCATTTGTGGCTATGTGACATAGTTCTGG 
ACAGTGAACATAGACAGAAGT CCCTGGGGCGGGCTTCCTTTCTGGGA TGAGGGCAAAACG 
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GATCTCTTGATCCCAGGAGGTCAAGGCTGCAATGAGCTAAGATCAAGCCACTGCATTCCA 
GCCTGAGTGATAGTGGGAGACCTTGTCTTTAAAACACACACACACACACACACACACACG 
AGGG C CTTT G AC C ACTC TT G AGT AG AAG AC TC G AG AAG AAC AAAG T AG AAG G C C AG AG AA 
GAACAAAGTTACTTGAAAGATCTCTTATTAAAGAGAATGTACAAGCTATGAAAAAAAAAA 
AACACACACACACACACAAACCTCATCTGGAATGAAAAAAACATAATGCATTTGGTTTCT 
GGTTCCTTAGGCTGTTATGGAACAACCAAAGAACATTATTTTGGTTTCTGAGGTCAGAAC 
TATTTTATTCCCCTCAAGCACACTATGCTTATGGTTTGAGGGAGAATGAGAAATAGGAAA 
CTAGGAACAGGCTGAAATGGTCTAATCTTGACCATCTAATTCTGCAGTGTCTTATTCTCA 
TTCT AAAAG AG AATGGTT AT ATT C G C TGTT CTAGC AT AAAAAGT AATG AT AAAAAT AAAA 
GATCCCGTATTACCAGACAATAATCCCCTAGACTGTTTTAATGCTTGGTTGAGTATTTGC 
TTATGATCTCAGACTTTAAAAGATGGTCTCCCCCTATGGTGAAGCTTGTTAATTATGTAG 
GCATCATTAATGTCTGTTTACTTATCAAAATTTTATCATTGTTAGTTGTATTACTACTTG 
ACAGTCCAATTTATTTAATTGAAAAGATTGGTTAACATTTTATAGTCAAAGTAATTGTTT 
prTr-TnTTTTTTrrTnTTTAG GTTATTGGAGTGATGAGTAAAGAA TACATACCAAAGGGC 
ACACGTTTTGGACCCCTAATAGGTGAAATCTACACCAATGACACAGT TCCTAAGAACGCC 
AACAGGAAATATTTTTGGAGG GTAAGTAAGGGAAATTTCTTCAGACCCATTAAATGTTAG 

GAAAAAATGGAGCT AAAAG AG CTGGGTGGCT CACCT TTC TC AT C CTGTGC T G AG AAATGC 

TGGGGCTCACCCATAAGTATCCAGCATCCCCATGGACACAGGGAATTCTGAACAAATGTG 

ATGAAACCGATGAAATGTCTGGCCTGTAGGTGGTTAGTGATGGAGATACGGGCTATATGT 

GAATCTTGATTTTTGCAATTCATTAGAGCTTTGTAATGAAAGGAAACAGTTTGTTGCTTG 

CTTTAAGGATAGGTTCATTTGCATTT CTCCGCAAGGAAGTAGTAATGAGTTACCAAG CCT 

TAGATTTCACCCCTTTTTGATTTCTTGCTGACTTAACTTTAATTGAATGGAAGAGTTATC 

ACAAATGAATTATCTTTTTGGTTTTTTTTTTTTTGAGATGGAGTCTCACTCTGTCACCAG 

GCTGGAGTGCAATGGCATGATCTCGGCTCACTGCAACCTCCGCCTCCCAGGTTCAAGCAA 

TTGTCCTGCCTCAGCCTCCCGAGTAGCTGGGACTAAGGTGCGCGCCACCATGCCCAGTTA 

ATTTTTGTATTTTTAGTAGAGACGGGGTTCCACTATGTTGGCCATGATGGTCTCGATCTC 

TGGACCTCGTGATCCGCCCACCTTGGCCTCCCAAAGTGCTGGAATTACAGGCAAGAGCCA 

CCGCGCCCAGCCAGGAATGACAAATGAATTACCTTATAAGTAAATGCCATTAAGGAAGGA 

TAGCTGGAAGATGGGTTGAGGGGAATGGAGGACCACAGAACTAGTCCTATTTAAATACAT 

GTGCATGGTAAAATG ATT C C ATTTGACAAT AGGTT AATTAT CTC AT AGC AT AAGG AAAAT 

GCTTAACAGTCATATGCAAGATGATAAGCTTTCCTATAGCATCCAACCAAAAGATCTAGC 

C AGTACAATTT C CTTTG CT AT ATT AGGGTTAGAAAGGC C CC C AG AG GTGAAC CAATT AG A 

T GG AATCCTTG AAT AAAAC AC TGG ATT AGCAGTG AAC AG AAAAAAGT C AG ATTG CT TT C C 

TT CTT C CC AT AG ATGT C TC AGGG ATATTTAGTTTC CT CAG AAG ATAAAG AATTT AG T AAG 

CGTTTTTTTGTGC AT AC TTAC ATGAAATGTAC ATT ATTTGAATT CTTT AAAAAGAAAC AG 

CTGCATGATAACAAAAATTGTGTTATGCTTGCTTTAGCTGGTATTTTTGCCTAGAACGAT 

TAT AT CGTTCGGAC AAG AAGCTATTC CTAAG AAACAAT ATTTT T AATC CAGG AAGTTTTT 

CATTTTTAGAAATTTATCTTACTATTTCCCAAGCAAAAGAGGGTAGTTACAGATTCACTA 

AGAATCATGTGCTCACAATTTTTATTTAATAATTATTCCTCCTTAAAATATATTAATCAC 

CTGACTTACAATGGTGGAACCATGAGTGCATTTTTGCCTTTATTGTCAATAACGTCTTCT 

C AG AAGTG AGC CAC AAAGGTG CATAGTTCTTGG AGTT AAAGGT CTG AATT AAG AC AAT C C 

AGCATAAGT CT C ATT AATGTGTGATTATTTTGAGAAAAGGCAAGAAGTAC CTAAGAAT CT 

CCCCCTCACTGTCCAGTTCCCTGTTTCATTTAAAGATTCACTGTAAGTAACTGAAAGGCT 

TTCCTTGGGAGGATTTATTTGAATCAGTCTTTCACATGCAAAGGATATTGTAGAACATCT 

CGTTTTTGCTGGCAGGAATATGAACATCTGTTGTGAGGAAAGAAAAAGTTTCATGCAAAT 

TACACTGCOUUGAAGGGATGTTCAAGTTGAGAAACCAGTGACATTTCTTGTAACTGTAC 

TATGAATCAGCGCATTTTAATCTTCTAGATAATATATGGAAGTGCAGGAAGGTGGTAGGA 

AACGGTGTTCATTTTACATATGCGTT ATTTT ATTCTGTGTGAGTGACTTCATGGC AC CGA 

CATTGCTGTTTTTAAATGAGGATACAGTAAATTGCAGTCCGAGGAAGGCTAACTGGAATC 

AACATACCCGTAGCTTTAGAAAGCAGTTTCCGCACCAGCGAAGAGTACAAGAGCGATGGA 

ACCCCATGTTCCTGGAAGTTTGCACATCAGAGTAAACAAACTTGAAAACCCCTCTTGATA 
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GCAGAATTCACCCAGCCTTGTTCCATTTTCTCTTAACAAAACACACCGCAAAAGCTCTCA 

CAAGCTGCTTTGATGAAGCCACATGTATTTCCCCCTTCACAATTTACAGGAAGTTACTCT 

TAAAAGAAAGTGATTCTGGTGTTTACCGCCTGTGTTAAAGGGACAGAGTTCCTTTTTATT 

TCTGATAACGTTTGAGCGAAATACAGAAACTATCTGTAGACTAGCATAGTCGGTACGTGA 

GTAAGGAAAAGCAATAACCTGCTGTCCGGTGAGCACAAAATTCCTGCTACGAACAGTGCC 

TTACTGCTGCTTGGAGACTGCAAGTCGCAGATCACACTAGGTATTGACTGATTGTATAAG 

G AAATTT CTT AAAGT CT AAAGT AAAGGTGGT AC CT C CT AAAAAG AG GGG AAG AG AG AAAA 

CTTTGTGTGGAAGGATAAGGAGTGTGTTTATAGTTTCAGTAAGAGTGTACGTTTTAATTT 

TTCTTCTTCCTCTGCCTCTTTGCCAAGTAGCCTGAGTGCATCTGTTATCCAGAAGTAGTA 

TTACTCTAGGACAAACTTCAAATTCTTCATTCTGCGTTGCCTTTAAGGAACAACATACTT 

TCTTCCTGTTCTTTTTCCAAAAACACACGCCTATGGCTCTGTGTGTGGTGTTTTAGCCAG 

CCTCCTCCCAGATAAGGGGTTCCCTTCCCTCCTTTGCATTGAAAGGAAAGTGCAAGTCTG 

G AC AT GTTT AT C AAG AGG AAAAGTG AC TTCTC AG T AAT AG ACTGT C AAATT C GGG CTG CT 

GCCCGAGTGTTCGCTTTGTTATGGCAGGTGAAGTTCACCTTTGCCCCACCCAGTGTTTCC 

ACAAAAAGGCAAGGTTCCAAGTATTCATATGAACAAGTGTTACTTTAGGACTTGGAGGGT 

TGGGGGTGGAGGATGTTTGCATAGTTGAAGCCTTGGGCGGGGGTGTAGGAAACGGCGAGT 

ACAGAGGCCATAGAAAAAGCTAAGACTCAGTTTGACGTCGTCAGCCGGCTTGGTCTTCTA 

CCCAGTGACTCAAAGCACTAAAAGTCAGCATAATCGGAACTGAAGTCAGTAGCATCGCCC 

ATTTGCCATTCACTGCAGTAGCAAAAGTAGTACTCTGTGGTGGGTTAATCGGTTTGAGGC 

AG CT C CTT AAATG AAC ATTTGTGTTT C ATTTTT CTG TT ATTTTC C CG AAC ATG AAAAG AC 

GATAAAACTGAAATGGAAAAGGTAACTGACAAAAGTGTGCCTTACCTGTTTCCGCCCTGA 

TTTCTGCTGATTCAAGACTATTCTGGCTAAACTGATTGGATTCTTTTTCTAACTAGGCAG 

TAGGGGATCAGAAATCACACACGGTACCGGCTGTGTTTATTCTGAGAGGTGCTGGGGAGC 

TTTGGGTCTGArTT^^TT^^^aT^rrTnTrTTrTCTTTTGGACAGATCTATTCCAGAGG 

GGAGCTTCACCACTTCATTGACGGCTTTAATGAAGAGAAAAGCAACT GGATGCGCTATGT 

GAATCCAGCACACTCTCCCCGGGAGCAAAACCTGGCTGCGTGTCA GAACGGGATGAACAT 

CTACTTCTACACCATTAAGCCCATCCCTGCCAACCAGGAACTTCTT GTGTGGTATTGTCG 

GGACTTTGCAGAAAGGCTTCACTACCCTTATCCCGGAGAGCTGACA ATGATGAATCTCAG 

TAAGTGG ATT AC AG AAC AAAAAAATAAAAAATGC C AGT AAT GT CGGTT CTG C C C CT TTG A 

ACTAATAACATGTTGTTTAATTATACGGCTTTGTCATGTGTTGGATGAAGTAGGTGGCTT 

AAGCTAGGGACTAGGAAGAGGAAAAACATTTTTTGAGTCCCTATTAACTATTAGGAAACT 

TG ATC ATTTAAAAG T AT AT AT ATAT ATG AGG AGCT AC CTTG AGTTTTG AAT T C AGG ATGT 

T AC AGGAAGAAAT AT ATGTCC AATTCT AAT TT AT C C AAAAG C AGTTGG G AG AATT AC AGG 

GATTGGTCCAGACATGCTGCGTATGCAAGGTATAGCCCTCATCTGTGGTACTTTGGCAGG 

GCTTAGAC TG C ATC AAAATATTTATAGATGT ACATTTGAGTGTACAGTT AG G ATCT G ATG 

TGGAACATTGTAAGATCATTGCTAGAAAAACTTTGTCATAATTTTTCAATATTATTCTAA 

GTGAATAACCGTAAAGATTTTACATCTTAGCTTCCTTCCTTACAGTAAAAAAACTATCTG 

ATCTCTTG ATC AGT ATT ATAGTAGCCACCT ATC ACTTTATCTTAAC AAATT CTCAATTCC 

TTAGGTTTATGTGCTTTTACTTCTTTTATTTGATTAAAATTGCTGTCATGACCTCTCTCT 

GCAGAGGGCTGCATCATTTTGGTCATTCTCAAGTGATCTCTTTGAGCAATTTAAGAATTG 

CCATAAGATTCTAACCTCTGCTGTAACTATGGTTGTGTGTTCTTGGTTAGACCACTAAAT 

CTTATT AGCAGTTTT AAAAATTATTC CTTTTGGTTT AGAAGTT AAG ACT AAATGCT GAAG 

TTTTTGT AACTT TTGGTTTTGATATC ATTT C AAACTT AAG AAAAC ATTTGAAG AAAAGG A 

CAAAGAATTT C CACTTACC CTTTAC CCAGGTTT ACCAGTT ATTGAT AAGTAT ATC C ATTT 

GCTTTAC CAGAAGGCTAACTTGTTTTAGTT CTCATTTTCAC CTTTG AGAC ATTT GG AAT A 

AATATC AATGTT AACAT AAATTGG AATTTTG ACTTTG ATTTT AGG AC CAATG AACAAGC C 

AAGTACTTACCCTAGTCATATATAATCCAACTGTATGGTTATTTGGTATTCATTCCACAC 

TTCATTTTACTTGATCTCCCTTAAGATTGCAAGATTGTGTTTGCAGTTTTTCTGAAAATC 

TGGGGCTATAAAAGCATCAGGACCTCCCCCGTAGGGGAGGTCGTGTGTTTGGGGTCCTTA 

CACAACAGGTTAC CCTTGAGCTTCAGGAAAAGAACTGGCTCTCAGTTC CCCAGTTC CAGC 

TTAATGGGTCTAATTAGGTCCTGACCAAAAAGGTGGCAGTTCTTTTCCCTCATGTCTCTT 

CAGCGCTCCCCGAGACTCTGGAGACTCTGTCATATCCCTAGGGCTGAGCCTCCCAGGAAC 

CATTCGGCTGTTGTGGCATCTGTGTATGCCATGCCCAGTGCTGAGGACCTAGTAACAAAC 
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_GAACTCGTATTCCAGCTGTGCGTCTCAG 
TTAACATAGTGAGCCACTTCCACTTAAGGGT 



TTTCTTTAAACAGTTCATTTGAGGTGACCTACC 



ctccttaca^ct^^^ 

SSSSf«----^^ GGTGAccTAccccAGTGACTrrGCA 

GAAACTTTT1 



GAAACTTTTTTGCATGCTTCCCGCACCCTGTGCCAATCAAGGG^G^T^CCTG 

:tttattcctcaaagaaaggtt^^ 

TTGTGTTCAGAAGCAACTGTCATATATACTGTGAAATGACA^ 

STTGTGAAACCGGTTGTCTTAGGCGTGGCAG 

TGATGATTGAGACTCTGATCAGGAAAATTTC 
rGTGTCTCCAAATGAACTGTG' 
3AATCTCC ATGAGGGCTT AAA 
OTTTTOUVACAAACCAAAG^ 



TTTTCAAGC ACATTTCATTGT CCAATATTC ATAG 

rTCAC 

'TGTC 
iGAA' 
JGGA' 

rrrc 

CAAATTTCMCAGGGGG^TATTTTTl-^^^^^^^^^^ 



GTCAC AT TAAAACAAGATTCCTGCTGCCA^^ cTA ^ TcAT ^ GGccT ^ 7AGGTAGA 

rcc 

3A' 
AG' 

TTTCTAAAAACAAAGGAAAAGGAATAAAAi 



CTGATGATTGAGAU 11* i^i - - A CAATAG AGGTGGTGCA 

TTGTGTCTCCAAATGAACTGTGTTGGGTTTCCA^^ 



'TTTCTATCTATCTAACTAACCCATCTAGAAAA 



CASTTOACCAAATTATAGACTTCTAA^^ 

ACTCTTGAAATGACTCCGTCCGCCTAC^ 



TOATTTTCTTTTTCATGTTAAC^ 

AGCTCCACTGATTACTCAGCTGCTGAAGGATGATTTTTlAAKKiu 

TGGACTTCCTAATTTCCACCTGTAGAG^T^^ 
TTCTTTTAGAATAAGATGCAAA^ 
TTmGAOmACTAXATACTAQGC^^ 
CTCMCTTTTTTGTTGGCCCAATCAT^^ 
AGGTACTTAAGAAGAATCCCTGGCTAA^ 



AGCTCCACTGATTACTCAGCTGCTGAAGG^^^^^^^^^^^^^^^^^^^j, 

:TGAAGGCATTAGAGATAGCAAAC7 
rAAGTGTTTTGCATAGAAAGTTTAi 
yvTATCAGTTCAACATTCAAATTA' 
3AGGGGCAGTGCCACAGATGGACT 



TTTATGCTTATTGCACATTTATGCTA™^ 

GTCATGACWGTAAAGTTTTTTGTATTTC^ 
CATTATC^TTTOACCCTATATA^ 

TCCTTCCTGTGGCTGTGAGATGCCTTGCCTATCAGT^^GCTT^ 

TCCTTTACCATTTTAGCTTT^ 
CCTCACTGAAAGACCGATATTGGCCTGATAAG^^ 

TAGCGTrCTTCTCTGTGOTAWC^CTTCAGGCTC^ ^^xcccTCAAGCCA 
^CA^TAA^T^CTA^^CTCAAA^ ^^^c^ 
GTCAGCCTAGAGAATAC^mAAAG^^G^GG ^ GAQA ^ TrrTT 
GACCTATCAGATAGCAAGTGTOTAGTTCT^CTC^CTA^ 



^^Iggcttcagcatgatcccccaaacctgctgcctct 

TTCCTGAAGGCATCATTTATTG^™^^ 

gtctttgggaataagtgctttcctcttagcctot 

TTGAACTGC^^GGAACTACCTArrGTGG^^GGTG^G^ 

TAGGCTGTCTGCACATCKC^GAAGG^WTTCACTr CGAAAATTGA TGA 
CAGTTTG^CAGGGCTTTATC^^ 
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CCCAGTATTTTTCCACTCCATTAAAATGGAAGTTTTTTTTTTTTTTTTCTTTTTTGAGAC 
AGAGTTTTGCTCTTGTTGCCCAGTCTGGAGTGCAATGGCACAATCTCGGCTCACCACAAC 
CT C C AC CT C C CAG ATT C AAG C G ATT CTT CTG C CTC AGC CTC C C AAG TAG CTGGGATTACA 
GGTGTGCGCCACCACGCCCAGCTAATTTTGTATTTTTAGTAGAGATGGGGTTTCTCCATG 
TTGGTCAGGCTGGTCTCGAACTTCCGACCTCAGGTGATCCGCCCACCTCGGCCTCCCAAA 
GTGCTGGGATTACAGGCAAGAGCCACTGCATCCAGCTTAGGCTATCTTACTCCAGCCTAA 
ACAGCAATTTTCTATCATAAGGTCTGTACTAATGAAAACAGAATCACCCAAGGCTGCTGT 
TTGTTCTGTCTGTGCTGCCATTGTCCGCATTTTGCTGAGGAGGAAACGGAACTGCACTTT 
TGAGTGAGTGGCCCAGAGCCTTCTAGAATGAGAGTGCGTTGGAAGCCAGATATGTGGCGA 
TTGTGTCGCCAGCTGTTACTCAGGTTTTCTCAAGAAGGAGGAGCAACTTTGGCAGTTTTG 
CTTCAGTTCTCTCTAGCCCTCTGTGTAATCGCCCCTTTTTCTTTATTTCAGCACAAACAC 
AGAGCAGTCTAAAGCAACCGAGCACTGAGAAAAATGAACTCTGCCCAAAGAATG TCCCAA 
AGAGAGAGTACAGCGTGAAAGAAATCCTAAAATTGGA CTCCAACCCCTCCAAAGGAAAGG 
ACCTCT ACCGTT CT AAC ATTT C ACC C CT C AC AT C AG AAAAGG AC CT C G ATG ACT TT AG AA 
GACGTGGGAGCCCCGAAATGCCCTTCTACCCTCGGGTCGTTTACCCC ATCCGGGCCCCTC 
TGCCAGAAGACTTTTTGAAAGCTTCCCTGGCCTACGGGATCGAGAGACCCACG TACATCA 
CTCGCTCCCCCATTCCATCCTCCACCACTCCAAGCCCCTCTGCAAGAAGCAGC CCCGACC 
AAAGC CT C AAGAG CTC CAG C C CTCAC AG C AGC C CTGG G AAT ACGGTG T C C C CTGTGGG C C 
CCGGCTCTCAAGAGCACCGGGACTCCTACGCTTACTTGAACGCGTCCTACG GCACGGAAG 
GTTTGGGCTCCTACCCTGGCTACGCACCCCTGCCCCACCTCCCGCCAGCTTTCA TCCCCT 
CGTACAACGCTCACTACCCCAAGTTCCTCTTGCCCCCCTACGGCATGAATT GTAATGGCC 
TGAGCGCTGTGAGCAGCATGAATGGCATCAACAACTTTGGCCTCTTCCCGAGG CTGTGCC 
CTGTCTACAGCAATCTCCTCGGTGGGGGCAGCCTGCCCCACCCCATGCTCAAC CCCACTT 
CTCTCCCGAGCTCGCTGCCCTCAGATGGAGCCCGGAGGTTGCTCCAGCCGG AGCATCCCA 
GGGAGGTGCTTGTCC CGG CG C C CCAC AGTG C CTTCT CCTTT AC CGGGG C CG C C G C C AGC A 
TGAAGGACAAGGCCTGTAGCCCCACAAGCGGGTCTCCCACGGCGG GAACAGCCGCCACGG 
CAGAACATGTGGTGC AG CC CAAAGCTACCTC AG C AG CGATGG CAG C C C C CAGC AG C G ACG 
AAGCCATGAATCTCATTAAAAACAAAAGAAACATGACCGG CTACAAGACCCTTCCCTACC 
CGCTGAAGAAGCAGAACGGCAAGATCAAGTACGAATGCAACGTTTGC GCCAAGACTTTCG 
GCCAGCTCTCCAATCTGAAG GTAGGCCTTGAGAGAGAGCAGTCCAAGGGGCTGTGAGTGC 
ATGCTTGTGTTTGTATTTAGCTTGCTTTCCATGGGGTATCGATTGCATTTGCAGTAGTAT 
GAGCCCCCGGTTGGGGATAGTGGGTATGGATTCCGCCTGGCTTTTGCCACTTCTAGCTCT 
TTGACTTTGGACAAGTGACTTCCCTTCTCCTGATTTTCTTCTGAATAATAAAAAAATTAG 
GGGTTTGGACTAGAAGATTAGGTGAAACTCCCTGCTAGCCTGTGATTTTTGTGCTTTTAA 
GAAAAACACCATTCTGAAAACATGAAGATTTCTTCTTTTTAAGACTGTCTTGATGCTTTT 
CTTAAGATATTTGCATCAACACTTGAGTCTTGGAGCAGAAATGTTAGGTCTCAGAGCCAG 
rn^^ariartrafsarirTA&papaTfiTf^rn^CTTCCCAGGTCCACCTGAGAGTGCACAGTGG 
AGAACGGCCTTT CAAATGTCAGACTTGCAACAAGGGCTTTACTC AGCTCGC C CAC CTGCA 
GAAACACTAC CTGGTAC ACACGGGAGAAAAG CCAC ATGAATGCC AG GTGCG C AGT ATTTT 
CTGGGTAGACCTTCTGACCTTTGTAGAAAATGTCTGTGAGTCACCCTCCCATGTCCTATA 
TAGCCCGTAGTT AAAGC CAACACCAGATTCTGCGTTGTCCCATCCTGGACTGATGGCACT 
ATGGTCCTTCCCAGTACTTTGTATCTGCTGATGACTTGAGATGGCACAGCCAGCTTCCAG 
TGGGTGGGAAAATGGTAGGGGAAATAAACAGCCCCTCGTGTGCTGTGTGCCCACATCCCC 
CCGTTTGCTTAATACCACACTGGAGGTGCCACAAGGAGGCTTCTCACCTCCTAGGTTGCT 
GGGCGTTGGCCGGTAAGCCTGCCCCTCCCGTTGGCAACTCTTAATCTTCTGGCCTTCCTG 

CACCAGCAATCTCAAGACCCACCTGCGACTCCATTCTGGA GAGAAACCATACCAATGCAA 
GGTGTGCCCTGCCAAGTTCACCCAGTTTGTGCACCTGAAACTGCACAAGCGTCTGCACAC 
CCGGGAGCGGCCCCACAAGTGCTCCCAGTGCCACAAGAACTACATCCATCTCTGTAGCCT 
CAAGGTTCACCTGAAAGGGAACTGCGCTGCGGCCCCGGCGCCTGGG CTGCCCTTGGAAGA 
TCTGACCCG AAT CAATG AAG AAATCG AGAAGTTTG ACATC AGTGACAATGCTG ACC GG CT 
CGAGGACGTGGAGGATGACATCAGTGTGATCTCTGTAGTGGAGAAG GAAATTCTGGCCGT 
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GGTCAGAAAAGAGAAAGAAGAAACTGGCCTGAAAGTGTCTTTGCAAAGAAACATGGGGAA 

TGGACTCCTCTCCTCAGGGTGCAGCCTTTATGAGTCATCAGATCTACCCCTCATGAAGTT 

GCCTCCCAGCAACCCACTACCTCTGGTACCTGTAAAGGTCAAACAAGAAACAGTTGAACC 

AATGGATCCTTAAGATTTTCAGAAAACACTTATTTT GTTTCTTAAGTTATGACTTGGTGA 

GTCAGGGTGCCTGTAGGAAGTGGCTTGTACATAATCCCAGCTCTGCAAAGCTCTCTCGAC 

AGCAAATGGTTTCCCCTCACCTCTGGAATTAAAGAAGGAACTCCAAAGTTACTGAAATCT 

CAGGGCATGAACAAGGCAAAGGCCATATATATATATATATATATATCTGTATACATATTA 

TATATACTTATTTACACCTGTGTCTATATATTTGCCCCTGTGTATTTTGAATATTTGTGT 

GGACATGTTTGCATAGCCTTCCCATTACTAAGACTATTACCTAGTCATAATTATTTTTTC 

AATGATAATC CTT C ATAATTT ATTAT AC AATTT ATC ATT C AG AAAG C AAT AATT AAAAAA 

GTTTACAATGACTGGAAAGATTCCTTGTAATTTGAGTATAAATGTATTTTTGTCTTGTGG 

C CATTCTTTG TAG ATAATTTC TG CAC AT CTG TATAAGTAC CTAAG ATTTAG TTAAA CAAA 

TATATGACTTCAGTCAACCTCTCTCTCTAATAATGGTTTGAAAATGAGGTTTGGGTAATT 

GCCAATGTTGGACAGTTGATGTGTTCATTCCTGGGATCCTATCATTTGAACAGCATTGTA 

CATAACTTG GGG G T ATG TGTG C AGG ATT AC C CAAG AAT AACTTAAGT AG AAG AAAC AAG A 

AAGGGAATCTTGTATATTTTTGTTGATAGTTCATGTTTTTCCCCCAGCCACAATTTTACC 

GGAAGGGTGACAGGAAGGCTTTACCAACCTGTCTCTCCCTCCAAAAGAGCAGAATCCTCC 

CACCGCCCTGCCCTCCCCACCGAGTCCTGTGGCCATTCAGAGCGGCCACATGACTTTTGC 

ATCCATTGTATTATCAGAAAATGTGAAGAAGAAAAAAATGCCATGTTTTAAAACCACTGC 

GAAAATTTCCCCAAAGCATAGGTGGCTTTGTGTGTGTGCGATTTGGGGGCTTGAGTCTGG 

GTGGTGTTTTGTTGTTGGTTTTTGTTGCTTTTTTTTTTTTTTTTTTTTTAATGTCAAAAT 

TGCACAAACATGGTGCTCTACCAGGAAGGATTCGAGGTAGATAGGCTCAGGCCACACTTT 

AAAAACAAACAC AC AAAC AAC AAAAAA CGGGT ATT CT AG TC AT CTTGGGGTAAAAGCGGG 

TAATGAACATTCCTATCCCCAACACATCAATTGTATTTTTTCTGTAAAACTCAGATTTTC 

CTCAGTATTTGTGTTTTTACATTTTATGGTT AATTT AATGGAAGATGAAAGGGCATTGCA 

AAGTTGTTCAACAACAGTTACCTCATTGAGTGTGTCCAGTAGTGCAGGAAATGATGTCTT 

ATCTAATGATTTGCTTCTCTAGAGGAGAAACCGAGTAAATGTGCTCCAGCAAGATAGACT 

TTGTGTTATTCTATCTTTTATTCTGCTAAGCCCAAAGATTACATGTTGGTGTTCAAAGTG 

TAGCAAAAAATGATGTATATTTATAAATCTATTTATACCACTATATCATATGTATATATA 

TTTATAACCACTTAAATTGTGAGCCAAGCCATGTAAAAGATCTACTTTTTCTAAGGGCAA 

AAAAAAAAAAAAAAAAAAAAG AACACT C CTTT CTGAGAC TTTG C TT AAT AC TTG GTGACC 

TCACAATCACGTCGGTATGATTGGGCACCCTTGCCTACTGTAAGAGACCCTAAAACCTTG 

GTGCAGTGGTGGGGACCACAAAACAACCAGGGAGGAAGAGATACATCATTTTTTAGTATT 

AAGGACCATCTAAGACAGCTCTATTTTTTTTTTGCCACTTTATGATTATGTGGTCACACC 

GAAGTCACAGAAATAAAAAACTGACTTT AC CGCTG C AATTTTT CTG TTTT C CT C CTTAC T 

AAATACTGATAC ATTACTC CAATCTATTTTATAATT ATATTTGAC ATTTTG TT C AC ATCA 

ACTAATGTTCACCTGTAGAAGAGAACAAATTTCGAATAATCCAGGGAAACCCAAGAGCCT 

TACTGGTCTTCTGTAACTTCCAAGACTGACAGCTTTTTATGTATCAGTGTTTGATAAACA 

CAGTCCTTAACTGAAGGTAAACCAAAGCATCACGTTGACATTAGACCAAATACTTTTGAT 

TCCCAACTACTCGTTTGTTCTTTTTCTCCTTTTGTGCCT 

AAAGACTTCTTGCTTCTCTCACCATCCATCCTTCTCTTTTCTGCCTCTTACATGTGAATG 
TTGAGCCCACAATCAACAGTGGTTTTATTTTTTCCTCTACTCAAAGTTAAAACTGACCAA 
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GTCTGGACTTGTGGTGCGCTGCCAGGGATCCGCAGCGTTGCCGGTTGTATTCGCTGGATACCAGAGGGCG 

GAAGTGCAGCAGGGTTCAGCTCCGACCTCCGCGCCGGTGCTTTTTGCGGCTGCGCGGGCTTCCTGGAGTC 

CTGCTACCGCGTCCCCGCAGGACAGTGTGTCAGGCGGGCAGCTTGCCCCGCCGCCCCACCGGAGCGCGGA 

ATCTGGGCGTCCCCACCAGTGCGGGGAGCCGGAAGGAGGAGCCATAGCTTGGAGTAGGTTTGGCTTTGGT 

TGAAATAAGAATTTAGCCTGTATGTACTGCTTTAACTCCTGGAAGAATGACAGATGACAAAGATGTGCTT 

CGAGATGTGTGGTTTGGACGAATTCCAACTTGTTTCACGCTATATCAGGATGAGATAACTGAAAGGGAAG 

CAGAACCATACTATTTGCTTTTGCCAAGAGTAAGTTATTTGACGTTGGTAACTGACAAAGTGAAAAAGCA 

CTTTCAGAAGGTTATGAGACAAGAAGACATTAGTGAGATATGGTTTGAATATGAAGGCACACCACTGAAA 

TGGCATTATCCAATTGGTTTGCTATTTGATCTTCTTGCATCAAGTTCAGCTCTTCCTTGGAACATCACAG 

TACATTTTAAGAGTTTTCCAGAAAAAGACCTTCTGCACTGTCCATCTAAGGATGCAATTGAAGCTCATTT 

TATGTCATGTATGAAAGAAGCTGATGCTTTAAAACATAAAAGTCAAGTAATCAATGAAATGCAGAAAAAA 

GATCACAAGCAACTCTGGATGGGATTGCAAAATGACAGATTTGACCAGTTTTGGGCCATCAATCGGAAAC 

TCATGGAATATCCTGCAGAAGAAAATGGATTTCGTTATATCCCCTTTAGAATATATCAGACAACGACTGA 

AAGACCTTTCATTCAGAAGCTGTTTCGTCCTGTGGCTGCAGATGGACAGTTGCACACACTAGGAGATCTC 

CTCAAAGAAGTTTGTCCTTCTGCTATTGATCCTGAAGATGGGGAAAAAAAGAATCAAGTGATGATTCATG 

GAATTGAGCCAATGTTGGAAACACCTCTGCAGTGGCTGAGTGAACATCTGAGCTACCCGGATAATTTTCT 

TCATATTAGTATCATCCCACAGCCAACAGATTGAAGGATCAACTATTTGCCTGAACAGAATCATCCTTAA 

ATGGGATTTATCAGAGCATGTCACCCTTTTGCTTCAATCAGGTTTGGTGGAGGCAACCTGACCAGAAACA 

CTTCGCTGCTGCAAGCCAGACAGGAAAAAGATTCCATGTCAGATAAGGCAACTGGGCTGGTCTTACTTTG 

CATCACCTCTGCTTTCCTCCACTGCCATCATTAAACCTCAGCTGTGACATGAAAGACTTACCGGACCACT 

GAAGGTCTTCTGTAAAATATAATGAAGCTGAAACCTTTGGCCTAAGAAGAAAATGGAAGTATGTGCCACT 

CGATTTGTATTTCTGATTAACAAATAAACAGGGGTATTTCCTAAGGTGACCATGGTTGAACTTTAGCTCA 

TGAAAGTGGAAACATTGGTTTAATTTTCAAGAGAATTAAGAAAGTAAAAGAGAAATTCTGTTATCAATAA 

CTTGCAAGTAATTTTTTGTAAAAGATTGAATTACAGTAAACCCATCTTTCCTTAACGAAAATTTCCT 

TTTACAGTCTGTCTATTGGTATGCAATCTTGTAACTTTGATAATGAACAGTGAGAGATTTTTAAATAAAG 

CCTCTAAATATGTTTTGTCATTTAATAACATACAGTTTTGTCACTTTTCAAGTACTTTCTGACTCACATA 

CAGTAG ATCACTTTTTACTCTGTGTTAC CATTTTGACTGGT CGT C ATTGGCATGGGGTGG ATATAGGGCA 

TAGGATTACTTGTCTCAGAAGCTGTCATAGAATTTCTTGCTGCCAATTAAAAAACCTGTGTTCTTTACAC 

ACTACACGT ATAAATATTGTAACTGTTC ATCTTTGTTGTTTTATCACTGT AAGC CTGTCAAAT CAT AGTA 

TCCTAAGCATCTGTAAATGCTAATTTTGCATTTTTGGAAAAACCCATTCCTTCCAAGCTAGTGTTTTTCA 

TTGGCTCCAGGTCTAATTTTTCACTGTGGTCCCTGGCAGCCAGTCTTTTGAAGTTTAAAGATTACCTGTC 

TCTTGACTGCAGTACCTTTTCTTTAATTTTTACCAAAAATATCCAGAGGTTACTGGAGTTCTTATTCAAT 

ATAAGGAAAG TTTG CTG CACTTTATTAC CAAGC CT CTGGG ATTTT AC CAGTC AAAC ATATTTGTG CATT A 

CATTTCATTTCTTGTGAGCTAGCTGGCTGTCCATATTGAATGTTGACCCATTTGAGTACGCTAAAAGGCT 

TACAGTATCAGACACGATCATGGTTTTAGATCCCATAATAAAAATGRATGTTTTTCTTATAAAAAATTAT 

ACAAATGCTGAAGTGAGATTCTACTATTGTTCATTGCTTCCTTTTCTTTTTCCTTTTGCGATTTTC^CTG 

ATTAATAGCACATTTCTTCACAAAArTAGATAAAGTTGGTCAAAGACCAGATATTCTGGAATGGAAATTG 

TAAAGCTTAATCAAAAAGAATAGCCAGTACAGCATACAATCTCAGAAACTTAGAAGCAAGTAGAAAATAA 

TTGGTTGATGTAAACGAAAGTGCCATTTTAGTAAAGGCAGGAAAAAAATAGCAATATTTGAGTTATGTAA 

GGATAAAAAATCCACTGACTTGTATTTTTGCAC^ 

TGTTTATTCGTCGGTTCATTTTGGGGATTTTCCCCCTTGATGTTTTGACAGATTGAAGTGAGCTTTAGTG 

AGCAAAAGGATCAGAATGCAGGGAACACn'AAGCTGTGATGAAGAAAGTGTGGTAAAAAGCCAGAGTAGTT 

TTATACAGACAAAACCAGTGTCAGGCCTTTGCAGTAGGCTTGAGTGAACTTCTGATCTAGATTTGAAAGT 

AAATTTTATGAAGACATTGCCCATTTTTACTTCCTCATTCATTATTGTACCAGCATC 

TCTAATCCCAGGTAAGTCAAGCCTACAATGCCCTAGAGGAAGAGTAAAACCAGAAATTCATGCTGGCTTA 

AATAATCTATTTTTGTTTCTTTTCATTTGAATATTTAAATTTTATGGTTTATTAAAAAA 

AGAAAAAAAAAAAAAAAAAAAA 
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GAATTCCGGGAAGCCAGACGGTTAACACAGACAAAGTGCTGCCGTGACACTCGGCCCTCCAGTGTTGCGG 

AGAGGCAAGAGCAGCGACCGCGCACCTGTCCGCCCGGAGCTGGGACGCGCGCCCGGGCGGCCGGACGAAG 

CGAGGAGGGACCGCCGAGGCTGCCCCCAAGTGTAACTCCAGCACTGTGAGGTTTCAGGGATTGGCAGAGG 

GGACCAAGGGGAC ATGAAAATGGACATGGAGGATGCGGATATGACTCTGTGGACAGAGGCTGAGTTTGAA 

GAGAAGTGTACATACATTGTGAACGACCACCCCTGGGATTCTGGTGCTGATGGCGGTACTTCGGTTCAGG 

CGGAGGCATCCTTACCAAGGAATCTGCTTTTCAAGTATGCCACCAACAGTGAAGAGGTTATTGGAGTGAT 

GAGTAAAGAATACATACCAAAGGGCACACGTTTTGGACCCCTAATAGGTGAAATCTACACCAATGACACA 

GTT CCT AAG AAC GC C AACAGG AAATATTTTTGG AGG AT CT ATTC C AG AGGGG AG CT TC AC CACTT CATTG 

ACGGCTTT AATG AAG AG AAAAGCAACTGG ATGCGCT ATG TG AATCC AG CAC ACT CT C C C CGGG AGC AAAA 

CCTGGCTGCGTGTCAGAACGGGATGAACATCTACTTCTACACCATTAAGCCCATCCCTGCCAACCAGGAA 

CTTCTTGTGTGGTATTGTCGGGACTTTGCAGAAAGGCTTCACTACCCTTATCCCGGAGAGCTGACAATGA 

TGAATCTCACACAAACACAGAGCAGTCTAAAGCAACCGAGCACTGAGAAAAATGAACTCTGCCCAAAGAA 

TGTCCCAAAGAGAGAGTACAGCGTGAAAGAAATCCTAAAATTGGACTCCAACCCCTCCAAAGGAAAGGAC 

CTCTACCGTTCTAACATTTCACCCCTCACATCAGAAAAGGACCTCGATGACTTTAGAAGACGTGGGAGCC 

C CGAAATG C CCTTCT AC C CTC GGGT CGTTT AC C C C ATCCGGG C C CC TCTGC C AG AAG ACTTTTTG AAAG C 

TTCCCTGGCCTACGGGATCGAGAGACCCACGTACATCACTCGCTCCCCCATTCCATCCTCCACCACTCCA 

AGCCCCTCTGCAAGAAGCAGCCCCGACCAAAGCCTCAAGAGCTCCAGCCCTCACAGCAGCCCTGGGAATA 

CGGTGTCCCCTGTGGGCCCCGGCTCTCAAGAGCACCGGGACTCCTACGCTTACTTGAACGCGTCCTACGG 

CACGGAAGGTTTGGGCTCCTACCCTGGCTACGCACCCCTGCCCCACCTCCCGCCAGCTTTCATCCCCTCG 

TACAACGCTCACTACCCCAAGTTCCTCTTGCCCCCCTACGGCATGAATTGTAATGGCCTGAGCGCTGTGA 

GCAGCATGAATGGCATCAACAACTTTGGCCTCTTCCCGAGGCTGTGCCCTGTCTACAGCAATCTCCTCGG 

TGGGGGCAGCCTGCCCCACCCCATGCTCAACCCCACTTCTCTCCCGAGCTCGCTGCCCTCAGATGGAGCC 

CGGAGGTTGCTCCAGCCGGAGCATCCCAGGGAGGTGCTTGTCCCGGCGCCCCACAGTGCCTTCTCCTTTA 

CCGGGGCCGCCGCCAGCATGAAGGACAAGGCCTGTAGCCCCACAAGCGGGTCTCCCACGGCGGGAACAGC 

CGCCACGGCAGAACATGTGGTGCAGCCCAAAGCTACCTCAGCAGCGATGGCAGCCCCCAGCAGCGACGAA 

GCCATGAATCTCATTAAAAACAAAAGAAACATGAC CGGCTACAAGAC C CTT C C CT AC C CG CTG AAGAAGC 

AGAACGGCAAGATCAAGTACGAATGCAACGTTTGCGCCAAGACTTTCGGCCAGCTCTCCAATCTGAAGGT 

CCACCTGAGAGTGCACAGTGGAGAACGGCCTTTCAAATGTCAGACTTGCAACAAGGGCTTTACTCAGCTC 

GC C CAC CTGCAG AAACACTAC CTGGT ACACACGGGAG AAAAGC C ACATG AATG C CAGGTC TGC CACAAGA 

GATTTAGCAGCACCAGCAATCTCAAGACCCACCTGCGACTCCATTCTGGAGAGAAACCATACCAATGCAA 

GGTGTGCC CTG C C AAGTTC AC C CAGTTTGTG C AC CTG AAACTG CAC AAG CG TCTG C AC ACC CGGG AG CGG 

CCCCACAAGTGCTCCCAGTGCCACAAGAACTACATCCATCTCTGTAGCCTCAAGGTTCACCTGAAAGGGA 

ACTGCGCTGCGGCCCCGGCGCCTGGGCTGCCCTTGGAAGATCTGACCCGAATCAATGAAGAAATCGAGAA 

GTTTGACATCAGTGACAATGCTGACCGGCTCGAGGACGTGGAGGATGACATCAGTGTGATCTCTGTAGTG 

GAGAAGGAAATTCTGGCCGTGGTCAGAAAAGAGAAAGAAGAAACTGGCCTGAAAGTGTCTTTGCAAAGAA 

ACATGGGGAATGGACTCCTCTCCTCAGGGTGCAGCCTTTATGAGTCATCAGATCTACCCCTCATGAAGTT 

GCCTCCCAGCAACCCACTACCTCTGGTACCTGTAAAGGTCAAACRAGAAACAGTTGAACCAATGGATCCT 

TAAGATTTTCAGAAAACACTTATTT 
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CGCCGCCTGTGCAGCCGCTGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCTGCC 

GCCCCGGCTGCCGCGCCGCGCCGCTGCCTCTGCCCCGGCCGCCCCCGCCGCCGCTGCCGCCGCCGGCCCG 

CAGCCAGCCAGGCGGGCGGCCCAGCCCGCCTGAGCCCGCAGCGGCTGCCGCCGCAGCGTCGGGTCGCTGG 

GTGCGCGGGCTACCGCGGACCGAGCGGACCCGAGTGGGCGACCAGGCGCTTGCCCGCCCAGTGCCACTGC 

CGCCGCTTCCTCGCCGGAGCACAGGACCAGACACCTCCAGCGCCCGCTGCTGCTGCCGATGCGGCCCGGA 

CACTTTTAGCTGGGCGGGAGGGCTGGAGAGCCGGGGGCCGCCGAGAACCGCCAGCGAGCTGTGCCGAGAG 

CCGCGCCGACCCGCTGCGATCAGGGACAGGCGCCCGCCCGCCGCCGCCGCCTGGCCGCTATGGATCTATT 

CGACTTTTTCAGAGACTGGGACTTGGAGCAGCAGTGTCACTATGAACAAGACCGTAGTGCACTTAAAAAA 

AGGGAATGGGAGCGGAGGAATCAAGAAGTCCAGCAAGAAGACGATCTCTTTTCTTCAGGCTTTGATCTTT 

TTGGGGAGCC AT AC AAGGTAGCTGAATATAC AAACAAAGGT G ATG C ACTTG C CAAC CGAGT C CAG AAC AC 

GCTTGGAAACTATGATGAAATGAAGAATTTGCTAACTAACCATTCTAATCAGAATCACCTAGTGGGAATT 

CCAAAGAATTCTGTGCCCCAGAATCCCAACAACAAAAATGAACCAAGCTTTTTTCCAGAACAAAAGAACA 

GAATAATTCCACCTCACCAGGATAATACCCATCCTTCAGCACCAATGCCTCCACCTTCTGTTGTGATACT 

GAATTCAACT CT AATACACAG C AACAG AAAAT C AAAAC CTGAGTGGT C AC G TG AT AG TCATAAC C CT AGC 

ACTGTACTGGCAAGCCAGGCCAGTGGTCAGCCAAACAAGATGCAGACTTTGACACAGGACCAGTCTCAAG 

CCAAACTGGAAGACTTCTTTGTCTACCCAGCTGAACAGCCCCAGATTGGAGAAGTTGAAGAGTCAAACCC 

ATCTGCAAAGGAAGACAGTAACCCTAATTCTAGTGGAGAAGATGCTTTCAAAGAAATCTTTCAATCCAAT 

TCACCGGAAGAATCTGAATTCGCCGTGCAAGCGCCTGGGTCTCCCCTAGTGGCTTCCTCTTTATTAGCTC 

CTAGCAGTGGCCTTTCAGTTCAAAACTTCCCACCAGGGCTTTACTGCAAAACAAGCATGGGGCAGCAAAA 

GCCAACTGCATACGTCAGACCCATGGATGGCCAGGACCAGGCACCGGACATCTCACCAACACTGAAACCT 

TCAATTGAATTTGAGAACAGCTTTGGGAATCTGTCATTTGGAACACTCTTGGATGGAAAACCCAGTGCAG 

CCAGTTCAAAGACTAAACTGCCAAAGTTCACCATCCTCCAAACAAGTGAAGTAAGCCTTCCCAGTGATCC 

AAGCTGTGTTGAAGAAATCTTGCGGGAGATGACCCATTCCTGGCCTACTCCTCTCACTTCCATGCATACT 

GCTGQACACTCTGAGCAGAGCACCTTTTCCATCCCAGGACAGGAATCGCAGCATCTGACCCCAGGATTCA 

CCTTACAAAAGTGGAATGACCCAACCACCAGAGCTTCTACAAAGTCAGTGTCTTTCAAATCGATGCTTGA 

GGATGACCTGAAGCTGAGCAGTGATGAAGATGACCTTGAGCCTGTGAAGACCTTGACCACTCAGTGCACT 

GCCACTGAGCTCTACCAGGCTGTTGAAAAGGCAAAACCTAGGAATAATCCTGTGAACCCACCCTTGGCCA 

CTCCCCAGCCCCCACCTGCAGTGCAAGCCAGCGGGGGTTCTGGCAGCTCCAGCGAATCGGAGAGCAGCTC 

TGAGTCGGATTCAGACACTGAAAGTAGCACCACTGACAGCGAATCTAATGAGGCACCTCGTGTGGCAACT 

CCAGAGCCTG AGCCACC CTCAACCAACAAGTGGCAACTGGATAAATGGCTTAAC AAAGTGACATC CCAGA 

ACAAGTCTTTTATTTGTGGCCCAAATGAAACACCCATGGAGACTATTTCTCTGCCTCCTCCAATCATCCA 

ACCAATGGAAGTCCAGATGAAAGTGAAGACGAATGC CAGTCAGGTCCCAGCTGAACCCAAAGAAAGGCCT 

CTCCTCAGTCTCATTAGGGAGAAAGCCCGTCCACGGCCCACTCAGAAAATTCCAGAAACAAAGGCTTTGA 

AG CAT AAGTTGT CAAC AACT AG TGAG ACAG T G T C T CAAAGG AC AATTGGG AAAAAAC AG C CC AAAAAAG T 

TGAGAAG AACACCAGCACTGACGAGTTTACCTGGC CCAAAC CAAATATTAC CAG C AGC ACTC C C AAAG AA 

AAAGAAAGTGTGGAGCTTC ATGACCCACCAAGAGGC CGCAACAAAGCCACTGCCCACAAACCAGC C 

GGAAAGAACCAAGACCT AACATC CCTTTGGCTCCCQ AGAAG AAGAAGTAC AG AGGGC CTGGCAAG ATTGT 

GCCAAAGTCTCGGGAATTCATTGAAACAGATTCATCTACATCTGACTCCAACACAGATCAGGAAGAGACC 

CTGCAAATCAAAGTCCTQCCTCCGTGCATTATTTCTGGAGGTAATACTGCCAAATCCAAGGAAATCTGTG 

GTGCCAGCCTGACCCTCAGCACCTTAATCAGTAGCAGTGGCAGCAACAACAACTTATCCATCAGTAATG^ 

AGAGCCAACATTTTCACCTATTCCTGTCATGCAAACTGAAATCCTGTCCCCTCTGCGAGATCATGAGAA 

CTGAAAAACCTCTGGGTGAAGATTGACCTTGACTTACTCTCTAGAGTACCTGGCCACAGCTCACTCCATG 

CAGCACCTGCCAAGCCAGACCACAAGGAGACTGCCACAAAACCCAAGCGTCAGACAGCTGTCACAGCTGT 

GGAGAAACCAGCCCCTAAGGGCAAACGTAAGCACAAGCCAATAGAAGTTGCAGAGAAGATCCCTGAGAAG 

AAGCAGCGCCTGGAGGAGGCCACAACTATCTGCTTGCTCCCTCCTTGCATCTCACCAGCCCCACCCCACA 

AGCCTCCCAACACTAGAGAAAATAATTCATCCAGGAGAGCAAATAGAAGAAAGGAAGAAAAACTATTTCC 

TCCTCCACTTTCCCCACTGCCAGAGGACCCTCCACGCCGCAGAAATGTCAGTGGCAATAATGGTCCCTTr 

GGTCAAGACAAAAACATCGCCATGACTGGACAAATCACATCTACCAAACCTAAGAGAACTGAAGG 

TCTGTGCTACTTTCAAAGGGATATCGGTAAATGAGGGAGACACTCCAAAAAAGGCATCCTCTGCCACCAT 

CACTGTCACCAATACTGCTATTGCCACTGCTACTGTCACTGCTACTGCCATTGTCACCACCACTGTCACA 
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GCTACTGCCACCGCCACGGCCACCACCACAACTACTACCACTACCATTTCCACCATCACCTCTRCCATCA 

CTACTGGCCTCATGGATAGCAGTCACCTGGAGATGACGTCCTGGGCGGCTCTGCCCCTTCTATCCAGCAG 

CAGCACTAATGTCCGGAGACCCAAGCTCACTTTTGATGACTCGGTTCACAATGCTGATTATTACATGCAA 

GAAGCTAAGAAGCTGAAGCACAAAGCTGATGCACTGTTCGAGAAATTTGGCAAAGCTGTGAATTATGCTG 

ATGCCGCCCTCTCCTTCACTGAATGTGGCAATGCCATGGAACGCGACCCTCTGGAAGCAAAGTCCCCATA 

CACCATGTACTCTGAGACTGTGGAGCTCCTCAGGTATGCAATGAGGCTGAAGAACTTTGCAAGTCCCTTG 

GCTTCGGATGGGGACAAAAAGCTAGCAGTACTATGCTACCGATGTTTATCACTCCTCTATTTGAGAATGT 

TTAAGCTGAAGAAGGACCATGCTATGAAGTACTCCAGATCACTGATGGAATATTTTAAGCAAAATGCTTC 

AAAAGTCGCACAGATACCCTCTCCATGGGTAAGCAATGGAAAGAACACTCCATCCCCAGTGTCTCTCAAC 

AACGTCTCCCCCATCAACGCAATGGGGAACTGTAACAATGGCCCAGTCACCATTCCCCAGCGCATTCACC 

ACATGGCTGCCAGCCACGTCAACATCACTAGCAATGTGTTACGGGGCTATGAACACTGGGATATGGCCGA 

CAAACTGACAAGAGAAAACAAAGAATTCTTTGGTGATCTGGACACGCTGATGGGGCCTCTGACCCAGCAC 

AGCAGCATGACCAATCTTGTCCGCTACGTTCGCCAAGGACTGTGTTGGCTGCGCATCGATGCCCACTTGT 

JGTAGTGGGTGTTCTCAGATC TCTAGCATCACGAC C CAT C ACTCT ACCT CT AC CAGCGC ACTGATGGTCA 

CTGGTGGAACTCCACTCACTGGGGAACGTTCTCTTTGGTTATGTTTGTTTTTATGCTTCTTTTGTTATCT 

GTAAAAAACAGAAGTCATTGT AAGTTGACACTACAACTTAAGGGCAGTGT AC GT TTT ATT ACTTAGTCAT 

TTTTTTTCTTTTAGCATTTGATATGCATTTCTCAGATTCCACCATCTTTTTGTGCTTTATGGAATGACAG 

TC CCTAC AAT ATTGTTTTAAG C C CAC ACTAC CCAAAACAAAGAATGGG AAGCACTTGTG ATAAAGACAGG 

CTC CTG AGAAATGCAAC AAGTGGTCTTACATATAC ATG AG AACTTAGACAC AAGGG ACCATC C C C C AAAC 

T CTACTC TTATAC CCAG AAAAGAACAT ATTT CAGAATCTGT CAAACTTTTG TG T ATCC C ACAGATTCAAT 

CTTCAGGTGAGAATTTTCATTGTCAAAACCCACTGGTTAGATGTTGTAGCAACATCAT 

ATCAAGAAAAT AAATGAGCATAGCAATGCTACTCTTAAAAAGATGCTATGC CACACAAC C AGAGG ACTTT 

CTTGTTAGCATCCCTTTCCTGATTCCCTATTTTGTTAATTTTAATGATAAGAAGAAAGGGTGACATTTAT 

TTTGACAAGTTTTAGGCATCAGCTGGCATCAGTGTTTTTCAACTCC^ 

CTGGGGTTCTCTGTGTGCAAAGCTGTCCTTTTGAAGAACAGTTTGGTTGATGCATGCCTTAGTAGCCAAA 

ATGCTACACTCTAGACTTACAAGTGGGAGTTAAGAGAGGTCTGGAAAGTGTCGAACAAGGA^ 

TCTGCCT CCTTTGCAACAACAACATTTACACAGTTGGTAAG TGGGTCCAT AACTGGCAGG ATCT 

TGTATTT TGCTCAAATCTATGGGAACAAAAGTCAAGGTATCACTAC CTAGAAGTAATG AT ATACAGTTTT 

CTTCCTAGTGGCTTGAAAATCTGGACTTCCTCAATTATTATTCACATTTTCTCTCTTATAGGTTTTCTGT 

TTTCTACTTTCTTTTTTCTCTTATCTGTGTTTCCCTTTCCTTTGTTTGGCTCATTAACTTTTGACTGAAT 

TACAATTACTCCTTTTATTAAAGTCCATATTATTGTGAATCATTTCCATGAAAATTTCTAAGAAAACTCC 

AAACTCTCTAAATAGTAGCTAACTTTTATTTTTTTAAAATGAGTCGTGGGGTAGTGCTTCACCTTGAGAT 

GCTTTGAAAGAGCCCTAAACATTGGGAACCATTCACCTAATTTGGAGACATTTCTCACTGGTTGTGACTA 

CCCCCTTATGATCCTTCACATTCATTTTATGTCCCTAAACATC^CAATGTAAATATCATTTTTGATGTTC 

CAGCTCACCAGAAGATTCTTACACTTGGGGTAAACACTATCCATGCATTACTTACTGGTAATT 

GGTATATAATTCCATGTAGCCTTTAATATGCTGGGTTATCAAATTCTGTTCACTGAGTTATGACCAGATA 

AATAATAGATATGCACATGAAAG ATG CAAACTTGTGTGATTATTAAAG C CAG C C ATG CAG GT C CATG ATA 

GAAACAGCAGGTGATGACTCTGCACTCTCATTGTCAAGG 

ACTTGAGCTGTGCTCTGGTCATCTTTGAGTTTAAGGCCTTTTGTTGTATAAGGCTC 

CAATGGCTGAAGCCATGTTGTTAATATGGCTGATGGGAGCATCCCTGCAGCTGAACCCAGCAC^ 

GCTCCCACTGTGGTTGMCTTTATGTTTACAGTCTCAGCAACAACACTTATGCATCC^ 

TG AAAC CTGAAAGAATC TTTTCTGAGC CTCITAAAAGAGGAAAATGATGATAACATTAAAG ACTCTG^ 

ACCCAAGGTTGGTGTCACATATAAAAATTAAGCTGATGACTTTGCAGTGACTCAAGTTGTCTCT^ 

TGGTTTACCAGGTAGAGTGCCTGGCTATTACTATATAATGAAGCCCACTGGCTTGACTTGTAAGTTCAAC 

CTAAACCACJ^TCCTAGACCATCATGGATTTAGGAGTAGATTCTTCTrGAAATCCCACATCCAGAAACTA 

GACATTAGAATGTTGAGGCAGTTTCCCAGAGAAACAAGCATATTGCCTCATGGATGAAAGA 

CTAGTTTCAGTGACTTGTTATATCTACTTACATACAACAGGGAGGCAAGAGGATTCTCTGTCATCT 

TGACTGAGTGTAAAATATGTGCCAAGTCrTGCAGCACAGTGACCAAATCTGACA^ 

CACTTGATTATGTAGTAGACTCATTTATAAAGCAGCTTAGGAACT 

TTCCTATCCCTTGAGATAAGACATCTTTCAGTTTCATGATTAAGGATT 

GTTCATCACAGTGTAAATGGTGATGCGTGTCGTAGGTGTGCAGCTATTTGAGGGACTAAGGGATGGAGAT 
ATTCTGTCAAATGAATCTCTTCAGTATACCAGTTTGTGGGAGGGATATGAGACATGTGGATGGCAGTGAG 
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AGATCGTGCCTCTAGATCTTGATGGAGGCTTGGTGAGACACACTTAAATAAGCACGTGGAGGTTAGAATA 

GAGGGC AG AGT AAAAGG AAGCTC CATCTG AG CAAGT AC AC C AAAT G AT CTC AG C C C TGCAACTTG AC C C A 

GGTAGGGCCACCACTACGCCTTCACTTGTCACCCAAGCTCCAACCACAGAGAGTTTGACAAGTTTGTGTT 

ATGATGTTGGCTTGGCTTTGTATTTTTAATTAACTTTGGATTTTTAGTGGTTTTGTCATATAACTGTCTG 

AGTTTGGTAGGTAGGATTACTTTGAAAAGGGTTTACTAGTGTGGTCCTCCGGGTAGAATTTAGCTGTAAC 

ATGTTGTTAGCCAGCCTGTAGACTGTTAATTACTTAATAATCTCATTGGGAAAATACTAGTAGTTTTATA 

TTTGGATGACATAATTGGAAAAAGCAGATTAGCTGCTACTACTTTTAAAAGACTTAAGGTCGGGATGCCT 

TTTTTTCC7VTGTAAGGAAATGAAAAGACCCAAAATCTTCAGGCAAAAAGCAAG7TGCAAAATTAGAAACC 

ATTGGCTAAAAATGTGTTTTGTTGAGTTTCCAAATGGATGAATTTTCATTTGGACATTACATCACTAAAT 

TCATTAGATTTTGTCTGCATTGGAAAGATACTCTTCTAGCATATCTTTCCCAAAGATATCTAATTTGGAT 

TCTGTTTCATGCAAATTTGCATCCCGGAGGTTGAAGTTGGAGTTTGAGGTTGGAAAATATCTTTGAAGGC 

AGAAT CAGTTG AGTT GTG AGGGTGAAGC CT CACATACTTCT CAAC AGACATGATAAAATT C AC CTG C ATG 

AGTTGGC AGGTGG GAG AAC CAAACTGGAT CACTGGGTAAGACT ACTCAGT AAAG CAATGAACTG CTTGCT 

TAGAGAAG CATC ACT ATC C C CATTGAGAAAAATGTGTGGCAAG ATG ATACAGCTACACAGTAT C AAATG A 

ATGGGTCAATTCAGCACCCCCAAATTTAATTCTGTGGGGAAAAATTATTGAGCCAGTTGTCAGTGTTCTG 

TTACATGACTGGCAGACTAAATTCTTCATCGTTGTTGTTATTGTTGTTGTTGTTTCTCATTTTCACTCGC 

ACGGC CTT ATTCTC AT AATT AAAATCT AATT CATTTTCTCTTTAGTGTTAGTAG ACT C CAACAAC AGAAG 

TGG CATCTGTGT ATT C ATAATC AG C ATTTAC CCTGGCAGGAGACTAATCAGATAGG C CGGT CT CAGACAT 

TAATCCTACCATCTGATATTTTTGGTGAAGGAAAAAGTATTAATTCTCTTTCCATCCTCCTCCTCAGAAA 

TATAGAAGCCCTCTTTACCAAAATCATCACATTTTACTCTGTAATCTACCAGCTAAAAGAAAATTGCATT 

GAAGCCCCACAAAGCCAGATTGCAGTTCTTGCCCCTTTTTGCGTCTGACATGAGATGTTA^ 

CATTGTGCTCACATTGGGTTAGGGGACACTGAACTGCTTTTTAGATCCATGATCAGTCATCATTCTTCTA 

AGAGATTGGAGCTTTGCTGTTTCATTAACTGTGCAGTGTAGACTAATGGTGTTTAATAAAAATCATTCAA 

AATTTCAAACTCTTTTGCCAGTGACCTCAATTTTGTTGGCTCTGTGATTTGTATCAGACTTTGAGGAGGG 

AAGGGGGAAGTGAAGGAAGCCTACGTCCAGGCCCCTGACAGGATGCTGCAGTAGCAAGCTCAAGCTCGCC 

TGCCTGCCAGCAGTTGCTGGTGAGCAGCAGCATGCAGACCAGCTGTGGGAAGCCTCCTGAAGAATGCCCC 

AGCTGATGCTTTCAGCTGGGAATAGTTTGTTCCTATTGGGGAACTCATTGTTCTCCAGTCTCTGCAGCAG 

GAAGCCAGCTGTC^TATTCGGAGGGAATTTCAGATGCTTTACCTTTTTGGTTTTGTCCTGCATCACTCAT 

GTGGCTACGAAAGTGTCTCTGAGAAT AGAGCCCAATGTGGTGACAATGGGT AGTCAAATG CACC C CAGAT 

GCTCAAGCCCTGTTGTGGTTCTGCAGTGTTTATGAAATTGGGAGGAAGGAGACCCTGGACAGTAAGCAAA 

ATTGGAGACACTCCAACGAGGCTAAGTTAATGCCGTGTTGCCCAGAACAAGATCTAGCTTCTCATTTGGT 

CAGCCTAGCATGCAACCAGTGGTGTGCTGGTAAAATGTTTAACAACCAGCTCGCTGAGAATAGAAAGCAC 

CTGGTTTGCACCATTTGCCAATTTCCATGGCATAAATACTACCACTTTAGATGATTTTAAGCTACCAACT 

GTGATGTCACTGAACACATGGTTGGAAAGAGATGCACGCAGTTGGCTCTTGCAAGCCTGGGCAAAAATGC 

TTCAACACGCCACTGGATGCAGCCAGTCAGAGGGTTCATATTTAATATATGTGTTCA 

AGACACACAC^CAOVAACTCACCCTTACACACACACTTCGATGACTAAAAC^ 

ATGAAT CAATGTGTGAATGTAGAAAGCTTATGATAAGGCC CTAGAGGTATGGGTTG C CCTGGAAGC CTAG 

GTTTTAAGCAGGAGAATAGCTGAGAAGAATGAAGCCCTCCTGAGCTGAAAGGAGAGATGGATCAATGGAG 

ATGGTTCCATCATCTCCTTCCATATCTCACAGGTAAAATGGGCACTCAGAAAACCCTCACGATTGAT^ 

TTAAAAAGATAAGTGAGTGTTTTTTATTTTATTATTATTGTCATCATTATT 

TGTAACTTTTACATGTAACTAGGATAAAGTATTTACGGGAACTCTATGGA 

TACTGTGTTTTTCTTTTATGTGACGTGGAAACTCAGTAATTCTCCCACCTTCACATTGTTGTTCATAA^ 

ATTTTACTTTAGTTATTAGGGAATCTAAGTTTTTTGTTAACATTTGTTTTTA 

CTGTTTTAGCTCTGAACTCAAACCAGAATATCTCTGTATCAATTGCATGACTATTCA 

AAACCAAAATAATTCTTTTTCCACCCAGTACGAAGAAAACrrAAGCTCAGTAA 

AGTATATAATGAGGCTTTCATTAAATACACACAI^CACACA 

TTTTTAAATTAGGCCrrCCACACATAAATCATTTTGAAAGTAGAATAGAAAATCrr 

CTGGTCCTGTGCATCTTCTGCAGTTAATAAGAGGTTTGTATCTGGAAAGATGGAAGAACTTGTTCTA 

TCTTATTTTTCAAAAAAAAATTTCCATTTTCTCTCTGGGCCTGTA 

GGAGATCCATGTCTTACTCGCTCTTTCTGGCCCTTCTGTCTTTTGCCTCTGCAA^ 

CACGATAGCAGGGACTGGGGGTCTATCCTTTCATCGTATTGCTACAATATTTGTCCTTACTGGAAAAT 

TAACATCCGGGTCTGATTTAATTGGCATTACACTTACACAGGGACTCTGAGCACCCCCGTCACCACACCA 



FIGURE 26.3 



WO 99/67395 



PCT/FR99/01513 



64/64 

GACAGTGGACCAGTTTTCACAGCTACAAAGAGCTAGAAATGTGTTTAACATCATCCAGTGCATCCCCTAA 

TTCAAAACCATCCTCACTAATCAATCATATTCACCCATAAATATTACAAATGAGATTGATTCCATCTCAA 

GACAATTTGTCAAATACTTAATTTTCTTCCTGGATGATTCTACTTACTGGATATTTTAGAAAGAGAAATG 

TCTGAGATAAAATCCCTCACATTTACTCAATATAACAAATTACTGTTTCTACTCCTATTCTGAGTAGTGC 

TTCTGAAGATTGTTTGCTGTAGTGTTGTCTTTGATAAAATGAATGTCAGTAGTGAGCCTTTTAGAGATAC 

CATGCTCAGACATCCTCTTTGGGATCAGAAGATACCTAAAATTCTCCCCTTTTGCCCACTTGGTTAGATG 

AGTGATATATTCTTTGGATCCTGCAAAGAAGAGATTGGTTTCTTTTCTTTTCTGGTGGTGGTAGTGGTTG 

TATCTGTGGCTGTGATGGTTGTTGTTACTTGTCTCTCTCTCTCTCTGGCTCTGGCTTTTGCTTTCCTGCT 

AGTGTTCTTTCTCTTTCCAAACAAATAGTTAAATTAAACGTGAGCTTCTGAATTGTACTTGTTCATA 

TCAAAACATAACAGATTAATAAAAATAGATGTGTCCTGATTTAAAACATGCCCCCTGGAAAGGCATGCTG 

TATTATGAAATCGTGATAATATAACTGCATTATTACATGGCAGTATAAATATTAGTCTGTTGAATTCATT 

TGTCCAATTGTATAACTTTGTGGAGCAGTGTTTTGACCTTTGATACATAATTCTGGAGCAAGTGGAGTGG 

TTGCAGGCAGATGAGACAGTGTTATATCAGGATTTTTCAATCAACTTTAGTTGGAGGCCTGGCAATTACA 

AACATCTTCAGATGTTTCTGTAACCATTATAAATATGAAAAAAACCTCTTCAAAAAATTTCCCATAGTAC 

TTCAGTCAAGACTTTTTAGGTTTATCTTTTTTTTTTCATTTCTCCTTTTCCTTTTCCA 

GGGGGGGTTGTTATCATTGACTGAAGAAATATTTTGATTGCAATGGTCTCTCTCTCTCTCCCCCTCTCTC 

TCTCTCTCCTCTArTCTTTCCTCCTTCCCTCTGTCCATCACCCCTCATTAAAATATTGAAATCTGGAGTC 

TTTGATAAATCTGCATTAGACCAGGCTATATGCTAGGAATGAAATCTGGGCAAATATCGATGGGTTTTCA 

AAGAATG CT C CATGTTC ATTGGGC CC TTTCACACC C CACAG TGAT AAATGAAAAGG ATAG AGGTAGTTTT 

TTCAAAAGAGCACTTTAATAATATCC TCTGAG ACCT AATG C AGTTTAACAAATGACTC CAC CTATTTTT C 

CAGTAGGTAAATTGACTGAGACTTGCAAAATACCCCTGAGAGTTGTCAGGGGTGTCTTCTGCCTGGTCTA 

TAGCGTGTGTGTTTGCTTTGTATCTAACAGGCACATTCACGTCTCGTGTACTCATATGAAGTATTTCCTA 

ACATTCCCATTAGCCTGTATATAAGAATCAGAAAGATAATCCCAACATGTTGTAAATGAAGATGTGACTC 

TATAACCTTTCTCTTCTTCCTGGAAAAAAAAGGACATTTTCATGCATATTTTAAACAGAAATTTTGTATA 

TT T AAGTG T CAT AGAAAAT ATTT ATT GAGT AAC TGG G ACAC AAATGGG AATTTAATTG T C AT C AT ATG C T 

TTGTGTGTGGGGATGCTTACCAACACCATGTCGCTGGACCATTGTGGCAAGCCATAACTGCACAAAGAGT 

ACACATCGTCAGTGTGTGTGTGTGTGTGTGTGTGCGCGCACGCACGTGCGTGTGTGTGTCCCTGCATGTG 

CAACATGTCTAGCTTGCTGTCCTTCATGGGATTTTAGCTTTCCCTTCTTGAAAAACATTATTTTAC^ 

CCAGGAGGCCCTGGTTACATTACTATATGAAGGCAGTGATTTGAAATGAAAATTCCTTTCCTCTTGGAAG 

CTTTGGTCATAATATCATGGTTCAATTAAACGGATTCCACCGGACTTTGTGATGAAAAAGGCTCTGTTAA 

AATCCAATTGAGTTTCCAAGAGGAAATTGTAGTAGGTCAAGATGCATGAGAGGGAAGATGGAGGCCACCT 

CAGCTGGAGAACATGAGCTGAGTTGAGCCCTCAGTGTTGAAGTTGACTTGCTCCAAGCTGCAGTCTAAAA 

CCCTGGGGCCCGTGCCTGGCCTATGCTCCCTCCCAAGTAAGTAGAGGAGCAGAACCATCAGGAACAGCCT 

GCCTGGCTCCTATGAAGAAAACTTCCTGACGTCCTGTCCCCAAAGGAAGACCCTTTCCCCAAGGGCACCC 

CAGGTGGCCATTAAATTGTGATGATCATTCAGAAAGTGCCCCCTTGGCTTTATGAGAATCCAATTAGTCT 

TCTGAACCACCTTTTCTTGGGTGCAGATTTCCAACATTCATGCTCATTG 

TTCTTAACAAGCATGCTCGTCTTGTCAGAATTTCAGTAAGTTCCAATTTCCTGTACAGACCAGGGTAAAC 
TGTTCTAAAATCAATCAATTAATGAAATGTTATCTGGTTTTTAAAAG 

ATAAAACTATATCTGCCTGTGTGGCTTTGCATTTCAAATGTGTGGCGCACAAGCGTTTTGTTGGTGCTTT 
GTTCTCAGTACAGTAACTCTGTGTACAAACATTTTAATGTGGTTTTGTTGTTTTCCAACAAGATC 
GTAAAAATGATATTGGCTGAGCTGGTGCGTTGGTTTCTCTCATAGAGGCATTAACTATACTGCCAATGCA 
TTGAATTATTTAAAAATGCAAAATAAAATTTTTATGAAAATCTCA 
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<151> 1998-06-23 

<160> 122 

<170> Patentln Ver . 2.1 

<210> 1 
<211> 2599 
<212> ADN 

<213> Homo sapiens 
<400> 1 

atcccctgcc ttaatcgcca agctccttca ggagaacaaa gaacaggcca ttaccctgga 60 
gaagactggc aactgatttt acccacaagc ccaaacctca gggatttcag tatctactag 120 
tctgggtaga tactttcacg ggttgggcag aggccttccc ctgtaggaca gaaaaggccc 180 
aagaggtaat aaaggcacta gttcatgaaa taattcccag attcggactt ccccgaggct 240 
tacagagtga caatagccct gctttccagg ccacagtaac ccagggagta tcccaggcgt 300 
taggtatacg atatcactta cactgcgcct gaaggccaca gtcctcaggg aaggtcgaga 360 
aaatgaatga aacactcaaa ggacatctaa aaaagcaaac ccaggaaacc cacctcacat 420 
ggcctgctct gttgcctata gccttaaaaa gaatctgcaa ctttccccaa aaagcaggac 4 80 
ttagcccata cgaaatgctg tatggaaggc ccttcataac caatgacctt gtgcttgacc 540 
caagacagcc aacttagttg cagacatcac ctccttagcc aaatatcaac aagttcttaa 600 
aacattacaa ggaacctatc cctgagaaga gggaaaagaa ctattccacc cttgtgacat 660 
ggtattagtc aagtcccttc cctctaattc cccatcccta gatacatcct gggaaggacc 720 
ctacccagtc attttatcta ccccaactgc ggttaaagtg gctggagtgg agtcttggat 780 
acatcacact tgagtcaaat cctggatact gccaaaggaa cctgaaaatc caggagacaa 840 
cgctagctat tcctgtgaac ctctagagga tttgcgcctg ctcttcaaac aacaaccagg 900 
aggaaagtaa ctaaaatcat aaatccccat ggccctccct tatcatattt ttctctttac 960 
tgttctttta ccctctttca ctctcactgc accccctcca tgccgctgta tgaccagtag 1020 
ctccccttac caagagtttc tatggagaat gcagcgtccc ggaaatattg atgccccatc 1080 
gtataggagt ctttctaagg gaacccccac cttcactgcc cacacccata tgccccgcaa 114 0 
ctgctatcac tctgccactc tttgcatgca tgcaaatact cattattgga caggaaaaat 1200 
gattaatcct agttgtcctg gaggacttgg agtcactgtc tgttggactt acttcaccca 1260 
aactggtatg tctgatgggg gtggagttca agatcaggca agagaaaaac atgtaaaaga 1320 
agtaatctcc caactcaccc gggtacatgg cacctctagc ccctacaaag gactagatct 1380 
ctcaaaacta catgaaaccc tccgtaccca tactcgcctg gtaagcctat ttaataccac 1440 
cctcactggg ctccatgagg tctcggccca aaaccctact aactgttgga tatgcctccc 1500 
cctgaacttc aggccatatg tttcaatccc tgtacctgaa caatggaaca acttcagcac 1560 
agaaataaac accacttccg ttttagtagg acctcttgtt tccaatctgg aaataaccca 1620 
tacctcaaac ctcacctgtg taaaatttag caatactaca tacacaacca actcccaatg 1680 
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catcaggtgg gtaactcctc ccacacaaa" 

ctgtggtacc tcagcctatc gttgtttgaa 

attcttagtg ccccctatga ccatctacac 

taagccccgc aacaaaagag tacccactct 

tgcactaggt actggcattg gcggtatcac 

tcaagaacta aatggggaca tggaacgggt 

acttaactcc ctagcagcag tagtccttca 

tgaaagaggg ggaacctgtt tatttttagg 

cggaatcgtc actgagaaag ttaaagaaat 

gcttcgaaac actggaccct ggggcctcct 

cttaggacct ctagcagcta taatattgct 

ccttgctaac tttgtctctt ccagaatcga 

gcagtccaag actaagatct accgcagacc 

tgttaatgac atcaaaggca cccctcctga 

ccccaattca gcaggaagca gttagagcgg 

ttttcctgtt gagatgggg 



agtctgccta ccctcsggaa tat t tt t cat 1740 

tggctcntca gaatct at at gcttcctctc 1300 

tgaacaagat ttacacagtt atgtcatatc 1860 

cccttttgtt ataggagcag gagtgctagc 1920 

aacctctact cag:::tar. acaaactatr 1980 

cgccgactcc ctggtcaccc tgcaagatca 2040 

aaatcgaaga gctttagact tgctaaccgc 2100 

ggaagaatgc tgttattatg ttaatcaatc 2160 

tcgagatcga atacaacgta gagcagagga 2220 

cagccaatgg atgccctgca ttctcccctt 2280 

actcctcttt ggaccccgta tctttaacct 2340 

agctgtaaaa ctacaaatcg agcccaagat 2400 

cctggaccgg cccgctagcc cacgatctga 2460 

ggaaatctca gctgcacaa: ctctactacg 2520 

tctcggccaa cctczccaaz agcacttagg 2580 

2599 



<210> 2 
<211> 1326 
<212> ADN 

<213> Homo sapiens 
<400> 2 

gccgcctggc actcctgagg gaagtataaa 
ttgtagaaaa ggcaaatgga gtgaagtgcc 
caactcacaa ttatgtaaaa agtgtgattt 
tccctatccc agcatccccg actccttccc 
tggtccaaaa ggagatagac aaaagggtaa 
aattatgacc cctccaagca gtgggaggaa 
ctttttctct cccagactta aagcaaataa 
ctgatggcta tattgatgtt ttacaagggt 
atataatgtc actgctaaat cagacactaa 
cagcctgaga gtttggcgat ctctggtatc 
aggaaagaga atgattcccc acaggccagc 
acacagaatc agaacatgga gattggtgct 
gactaaggaa aactaggaag aagtctatga 
gaagggaaga aaatcctact gcctttctgg 
cctctctgtc acctgactct tctgaaggcc 
agtcagctgc agacattaga aaaaaacttc 
tagaaaccct attgaacttg gcaacctcgg 
cggaacagga caaacgggat taaaaaaaag 
gtggactttg gaggctctgg aaaagggaaa 
tgcttccagt gcggtctaca aggacacttt 
ccccctcgtc catgcccctt atttcaaggg 
caaaggtcct ctgagtcaga agccactaac 
ctgggg 



ttataacacc atcttacagc tagacctctt 60 
ataagtacaa actttctttt cattaagaga 120 
atgccctaca ggaagccttc agagtctacc 180 
caactaataa ggacccccct tcaacccaaa 240 
acagtgaacc aaagagtgcc aatattcccc 300 
gagaattcgg cccagccaga gtgcatgtgc 360 
aaacagactt aggtaaattc tcagataacc 420 
taggacaatt ctttgatctg acatggagag 480 
ccccaaatga gagaagtgcc accataactg 540 
tcagtcaggt caatgatagg atgacaacag 600 
aggcagttcc cagtctagac cctcattggg 660 
gcagacattt gctaacttct gtgctagaag "20 
attactcaat gatgtccacc ataacacagg 780 
agagactaag ggaggcattg aggaagcgtg 84 0 
aactaatctt aaagcgtaag tttatcactc 900 
aaaagtctgc cgtaggcccg gagcaaaact 960 
ttttttataa tagagatcag gaggagcagg 1020 
gccaccgctt tagtcatgac cctcaggcaa 1080 
agctgggcaa attgaatgcc taatagggct 1140 
aaaaaagatt gtccaagtag aagtaagccg 1200 
aatcactgga aggcccactg ccccagggga 1260 
cagatgatcc agcagcagga ctgagggtgc 1320 

1326 



<210> 3 
<211> 10499 
<212> ADN 

<213> Homo sapiens 
<400> 3 

ccctggggcg ggcttccttt ctgggatgag 
ttgcaactga gagacaggac tagctggatt 
gctgggaagg tgaccacgtc cacctttaaa 



ggcaaaacgc ctggagatac agcaattatc 60 
tcctaggccg actaagaarc cctaagccta 120 
cacggggctt gcaacttagc tcacacctga 180 
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ccaatcagag agctcactaa aatgctaatt 
atcatccatt gcccgagagc acagcaggag 
tcgagctggc aacagcagcc cccctttggg 
tgctatttca ctctattaaa tcttgcaact 
cgagctgagc ttttgctcac cgtccaccac 
tgactcccat ccctctggat cctgcaggg- 
ccattgccgc tcccaattgg gctaaaggct 
ggtttgttct aattgagctg aacactagtc 
acggcttcta atagaactat aacacttacc 
cgtgaggcca agaactccag gtcagagaat 
tgctaccatc ttggaagtgg ttcaccacca 
ggtaacattt tggcaaccac gaacggacat 
cacttgctat tctgtcctat ccttccttag 
ccagttaaaa acgattagtg tggccaccgg 
gaagggcttt ctaacaaccc ccaacccttc 
gcttccactt tcagttttct tggggaagcc 
cctgaactcc cggcagtagc cggrtgagat 
ccatgcatgc acccctatct ttccttctga 
tcttcaaagt gtagccccaa aatcctcctc 
ctcctaggta ctattggttc agacttccat 
tctaaggaag ctctgcgctg cgtccttagg 
cctggrgtcc ctcccaattt aggcatacag 
ctccccacca cccttgccag ggccccaagt 
aggagagaga gagaaatgga ggagaaagag 
gagagacaga agagagagag agacaaagag 
gagaaagaaa tagtaaaaaa cagtgtgccc 
acctgtactt gataattgaa ggtcttctct 
ggtcagtgta aataagagca taggccgaaa 
cctatcaaaa atccttaacc cagtaacccg 
gcaactgctt tgctaaaagt agaaaagtaa 
ctcacctgtt cagaattatt ctaataaaaa 
tcttaaagta tggggctatt ctgttagaaa 
cccttaaccc agcagatttc ctaacgggat 
ccagacctag gcggaactcc cttcaggaca 
aggaaaaaaa ccacaatggg tattcagtaa 
tagaaaaatt gcctaataac tggtctcctc 
ccttaaagta cttacagaat caaaagacta 
ccctctctgt aatgcatttg cataagaact 
ctgggttgtt ataaaatagg aacccagccc 
caatgttggg catgctggta aaggaccact 
tggtcaagaa aggcgggaaa aggggtgcag 
gataaacaga ggtccatggg tggttacgca 
aggcaatgtt gggcacgctg gtaaaggacc 
ttgtggtcaa gagaggcagg aaaacaggtg 
ttcgataagc agaggtccat gggtggtgat 
tagaggacac tccaggacta aagctcatcg 
gttctttttt cagatgggaa acgttccccg 
ggagaattgg gaccaatttg accctcagac 
cagtgccgcc tggcactcct gagggaagta 
tcttttgtag aaaaggcaaa tggagtgaag 
gagacaactc acaattatgt aaaaagtgtg 
tacctcccta tcccagcatc cccgactcct 
caaatggtcc aaaaggagat agacaaaagg 
ccccaattat gacccctcca agcagtggga 
gtgccttttt ctctcccaga cttaaagcaa 
aaccctgatg gctatattga tgttttacaa 
agagatataa tgtcactgct aaatcagaca 
actgcagcct gagagtttgg cgatctctgg 



-N 
J 

aggcaaagac aggaggtaaa gaaatagcca 240 
ggacaacaat cgggatataa acccacgcat 300 
tcccttccct ttgtatggga gccgttttca 363 
gcactctcct ggtccatgtt tcttacggct: 420 
cgctgtttgc caccaccgca gacctgccgc 480 
gtccgctgtg ctcctgatcc agcgaggcgc 540 
tgccattgtt cctgcacggc taagtgcctg 600 
actgggttcc acggttctct tctgtgaccc 660 
acatggccca agattccatt ccttggaatc 720 
acgaggcttg ccaccatct- ggaagcggcc 730 
tcttgggagc tc-grgagca aggacccccc 840 
ccaaagtggt gagtaatatt ggaccactrt 900 
aattggagga aaataccggg cacttgtcgg 960 
acttaagact caggtgtgag gctatctggg 1020 
cgggttgggg acttggtttg cctcaagcca 1080 
gagggccgac cagaggcaga aagctgtcg* 1140 
catggtgtag ccagaagtct caacagtcgc 1200 
cccatacctc ccgggtccca accacaactt 1260 
acctctgaat atacttcctc tgatccctgc 1320 
ttcctctagc aagttgratc tccaaaggga 1380 
cacctaggct ataacccagg gagtcttatc 1440 
ctcttgacar gggcagttat gtaggaccca 1500 
ttgtaaatgg ctgagggaaa agagagacag 1560 
agagagacag agaggagaga gagacagtga 1620 
gagagagaga gagtcaaaga gagaaagaaa 1680 
tattccttta aaagccaggg taaatttaaa 1740 
gtgaccctat agcactccaa tccactttgt 1800 
gcactgaggc cattgacaac ccgtagcttc 1860 
cagatggacc aaatgcattc agtcggtagc 1920 
cttttagagg aaacctcatt gtgagcacac 1980 
aagcaaaaag gtagcttact aactcaaaaa 2040 
aaggtaatgt aactccaacc actgataatt 2100 
ttaaatctta attaccatac aaaggtccga 2160 
ggacgataga tggttcctcc caggtgattg 2220 
ttgatacggg gactcttgtg gaagcagagt 2280 
aaacgtgtga gctgtttgca ctcagccaag 2340 
tctcaatcct gattcaaaag gttagctaca 2400 
tgtttatggg aatgcatctt gatggggcag 2460 
agctctagga ctcacccctg agcgcaaagg 2520 
agaatccagc agcccagacc cctttctttg 2580 
gactgctaca tcggtaagca taactaatcc 2640 
ccctggaaag gaactcaccc ctgagcacaa 2700 
actagaatcc agcagcctgg acccctttct 2760 
caggactgca acatcagtga gcataactaa 2820 
gcaccctgga aagaataagc attaggacca 2880 
gaaaatgact agggttgctg gcatccctat 294 0 
caagacaaaa acgcccctaa gacgtattct 3000 
actaagaaag aaacgactta tattcttctg 3060 
taaattataa caccatctta cagctagacc 3120 
tgccataagt acaaactttc ttttcattaa 3180 
atttatgccc tacaggaagc cttcagagtc 3240 
tccccaacta ataaggaccc cccttcaacc 3300 
gtaaacagtg aaccaaagag tgccaatatt 3360 
ggaagagaat tcggcccagc cagagtgcat 3420 
ataaaaacag acttaggtaa attctcagat 3480 
gggttaggac aattctttga tctgacatgg 3540 
ctaaccccaa atgagagaag tgccaccata 3600 
tatctcagtc aggtcaatga taggatgaca 3660 
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acagaggaaa gagaatgatt ccccacaggc 
tgggacacag aatcagaaca tggagattgg 
gaaggactaa ggaaaactag gaagaagtct 
cagggaaggg aagaaaatcc tactgccttt 
cgtgcctctc tgtcacctga ctctrctgaa 
actcagtcag ctgcagacat tagaaaaaaa 
aacttagaaa ccctattgaa cttggcaacc 
caggcggaac aggacaaacg ggattaaaaa 
gcaagtggac tttggaggct ctggaaaagg 
ggcttgcttc cagtgcggtc tacaaggaca 
gccgccccct cgtccatgcc ccctatttca 
gggacaaagg tcctctgagt cagaagccac 
gtgcctgggg caagcgccat cccatgccat 
cattgagggc caggaggttg tctcctggac 
tgtcccggac aactgtcctc cagatctgtc 
cactagatac ttctcccagc cactaagtta 
ttttctaatt atgcttgaaa gccccactac 
aggggccatt atacacctga acataggaga 
ggaaggaatt aatcctgaag tctgggcaac 
ccgtcctgtt caagttaaac taaaggattc 
cctcagaccc aaggcccaac aaggactcca 
cctagtaaaa ccatgcagta acccctgcag 
cagacagtgg aggttagtgc aagatctcag 
gccagctgta cctagccctt atactctgct 
tacagtcctg gaccttcagg atgccttctt 
cttgtttgcc tttgaagata cttcaaaccc 
ccaagggttc agggatagtc cccatctatt 
atcctcatac ctggacactt gtccttcggt 
cagaaacctt gtgccatcaa gccacccaag 
acatggtttc caaaccaaag gctcaactct 
atccaaaggc accagggccc tcagtgagga 
tcccaaaacc ctaaagcaac taaggggatt 
gattcccagg tatggcgaaa tagccaggtc 
agccaatacc catttagtaa gatggacaac 
ccaagcccca gtgttaagtt tgccaacagg 
aacaggaata gctctaggag tccttacaca 
atacctgact aaggaaattg atgtagtggc 
ggtggcagta gcagtcttag tatctgaagc 
tgtgtggaca tctcatgatg tgaatggcat 
agacaactgt ttacttaaat gtcaggctct 
cacttgtgca actcttaacc cagccacatt 
taactgtcaa caagtaattt ctcaaaccta 
tttgactgat cccgacctca acttgtatac 
tcgaaaagtg gggtatgcag tggtcagtga 
tccaggaact agtgctcagc tagcagaact 
agaagaaaaa agggcaaata tatatacaga 
ccatgcagca atatggaaag aaagggaatt 
tcaggaagcc attaggaaat tattattggc 
acactgccgg ggtcatcaga aaggaaagga 
tattgaagcc aaaagagctg caaggcagga 
cctagtatag ggtaatcccc tccgggaaac 
atggggaacc tcacgaggac agttttctcc 
aaatactttt gcctgcaact atccaatgga 
acttaggcat cgatagcacc catcagatgg 
tcaaaactat caagcagata gtcagggcct 
cttatcgcca agctccttca ggagaacaaa 
aactgatttt acccacaagc ccaaacctca 
tactttcacg ggttgggcag aggccttccc 



4 

cagcaggcag zzcccaqzzz agaccc _ca: 3~ 20 
tgctgcagac atttgctaac ttgtgcgc~a 375C 
atgaattact caatgacgtc caccataaca 3840 
ctggagagac taagggacgc attgaggaag 3900 
ggccaactaa tcttaaageg taagu ttaz z 3960 
cttcaaaagt ctgccgtagg cccggagcaa 4020 
tcggtttttt ataatagaga tcaggaggag 4080 
aaaggccacc gcttragtca tgaccctcag 4140 
gaaaagctgg gcaaattgaa tgcctaatag 4200 
ctttaaaaaa gattgtccaa gtagaagcaa 4260 
agggaatcac tggaaggccc actgccccag 4320 
taaccagatg atccagcagc aggactgagg 4390 
caccctcaca gagccctggg tatgct-gac 4440 
actggcgcgg tcttcttagr cttactcttc 4500 
actatctgag ggggtcctaa gacgggcag- 4560 
tgactgggga gcttta-tc- tttcacatgc 4620 
cttgttaggg agagacattc tagcaaaagc 4660 
aggaacaccc gtttgttgtc ccctgcctga 4/40 
agaaggacaa tatggacgag caaagaatgc 4800 
cacctcctti ccctaccaaa ggcagtaccc 48 60 
aaagattgti aaggacctaa aagcccaagg 4920 
cactccaatt ttaggagtac agaaacccaa 4930 
gattatcaat gaggctgttg ttcctctata 5040 
ttcccaaata ccagaggaag cagagtggtt 5100 
ctgcatccct gtacatccrg actctcaarc 5160 
aacatctcaa ctcacctgga ctattttacc 5220 
tggccaggca ttagcccaag acttgagcca 5280 
aggtggatga tttactttcg gccgcccact 5340 
cgctcttcaa tttcctcgct acctgtggct 5400 
gctcacagca ggttacttag ggctaaaatz 54 60 
acacatccag cctatactgg cttatcctca 5520 
ccttggcgta ataggtttct gccgaaaatg 5580 
attaaataca ctaattaagg aaactcagaa 5640 
tgaagtagaa gtggctttcc aggccctaac 5700 
gcaagacttt tcttcatatg tcacagaaaa 5760 
gatccgaggg atgagc::tgc aacctgrggc 5320 
aaagggttga cctcattgtz tacgggcagt 5880 
agttaaaata atacagggaa gagatcttac 5940 
actcactgct aaaggagac^ tgtggctgtc 6000 
attacttgaa gggccagtgc tgcgactgtg 6060 
tcttccagac aatgaagaaa agataaaaca 6120 
tgccactcga ggggaccttt tagaggttcc 6180 
tgatggaagt tcctttgtag aaaaaggact 6240 
taatggaata cttgaaagta atcccctcac 6300 
aatagccctc acttgggcac tagaattagg 6360 
ctctaaatat gcttacctag tcctccatgc 6420 
cctaacttct gagagaacac ctatcaaaca 6480 
tgtacagaaa cctaaagagg tggcagtctt 6540 
aagggaaata gaagagaact gccaagcaga 6600 
ccctccatta gaaatgctta taaaacaacc 6660 
caagccccag tactcagcag gagaaacaga 6720 
cctcgggacg gctagccacr gaagaaggga 6780 
aattacttaa aacccttcat caaacctttc 6840 
ccaaatcatt atttactgga ccaggccttt 6900 
gtgaagtgtg ccagagaaat aatcccctgc 6960 
gaacaggcca ttaccctgga gaagactggc 7020 
gggatttcag tatctactag tctgggcaga 7080 
ctgtaggaca gaaaaggccc aagaggtaat 7140 
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aaaggcacta gttcatgaaa taattcccag attcggactt ccccgaggc. tacagagiga /20C 
caatagccct gctttccagg ccacagtaac ccagggagta Lcccaggcct taggtatacg 726C 
atatcactta cactgcgcct gaaggccaca gccctcaggg aaggtcgaga aaatgaatga ^20 
aacactcaaa ggacatctaa aaaagcaaac ccaggaaacc cacc:caca: ggcctgctc- '380 
gttgcctata gccttaaaaa gaatctgcaa ctttccccaa aaagcaggac ttagcccata 7440 
cgaaatgctg tatgaaaggc ccttcataac caatgacctt g^gctcgacc caagacagcc '500 
aacttagttg cagacatcac ctccctagcc aaatatcaac aagttctcaa aacattacaa 7560 
ggaacctatc cctgagaaga gggaaaagaa ccattccacc cttgtgaca: ggtattagtc 7620 
aagtcccttc cctctaattc cccatcccta gatacatcct gggaaggacc ctacccagtc 7680 
attttatcta ccccaactgc ggttaaagtg gctggagtgg agtcttgga- acatcacact 7740 
tgagtcaaat cctggatact gccaaaggaa cctgaaaatc caggagacaa cgctagctat 7800 
tcctgtgaac ctctagagga tttgcgcctg ctcttcaaac aacaaccagg aggaaagraa /86U 
ctaaaatcat aaatccccat ggccctccct tatcatattt ttctctttac tgttcttrta 79^u 
ccctctttca ctctcactgc accccctcca tgccgctgta tgaccagtag ctccccttac ^980 
caagagtttc tatggagaat gcagcgtccc ggaaatattg atgccccatc grataggagt 8040 
ctttctaagg gaacccccac cttcactgcc cacacccata tgccccgcaa czqctazcac 8iou 
tctgccactc tttgcatgca tgcaaatact cattattgga caggaaaaa- gactaacccc 8160 
agttgtcctg gaggacttgg agtcactgtc tgttggactt actccaccca aactggca^g 8220 
tctgatgggg gtggagttca agatcaggca agagaaaaac atgtaaaaga agtaatctcc 828U 
caactcaccc gggtacatgg cacctctagc ccctacaaag gactagatc* ctcaaaacta 8340 
catgaaaccc tccgtaccca tactcgcctg gtaagcctat ;caaiaccac cctcactggg 8400 
ctccatgagg tctcggccca aaaccctact aactgttgga tatgcctccc cctgaacttc 8460 
aggccatatg tttcaatccc tgtacctgaa caacggaaca acttcagcac agaaataaac 8520 
accacttccg ttttagtagg acctcttgtt tccaatctgg aaataaccca tacctcaaac 8580 
ctcacctgtg taaaatttag caatactaca tacacaacca actcccaatg catcaggtgg 8640 
gtaactcctc ccacacaaat agtctgccta ccctcaggaa tattttttgi ctgtggtacc 8700 
tcagcctatc gttgtttgaa tggctcttca gaatctatgt gcttcctctc attcttagtg 8760 
ccccctatga ccatctacac tgaacaagat ttatacagtt atgtcatatc taagccccgc 8820 
aacaaaagag tacccattct tccttttgtt ataggagcag gagtgctagg tgcactaggt 8880 
actggcattg gcggtatcac aacctctact cagttctact acaaactatc tcaagaacta 8940 
aatggggaca tggaacgggt cgccgactcc ctggtcacct tgcaagatca acttaactcc 9000 
ctagcagcag tagtccttca aaatcgaaga gctttagact tgctaaccgc tgaaagaggg 9060 
ggaacctgtt tatttttagg ggaagaatgc tgttattatg ttaatcaatc cggaatcgtc 9120 
actgagaaag ttaaagaaat tcgagatcga atacaacgta gagcagagga gcttcgaaac 9180 
actggaccct ggggcctcct cagccaatgg atgccctgga ttctcccctt cttaggacct 9240 
ctagcagcta taatattgct actcctcttt ggaccctgta tctttaacc" ccttgttaac 9300 
t-r.r.gtctctt ccagaatcaa aqctqtaaaa ctacaaatgg agcccaagat gcagtccaag 9360 
actaagatct accgcagacc cctggaccgg cctgctagcc cacgatctga tgttaatgac 94^u 
atcaaaggca cccctcctga ggaaatctca gctgcacaac ctctactacg ccccaattca 9480 
gcaggaagca gttagagcgg tctcggccaa cctccccaac agcacttagg ttttcctgtt 9540 
gagatggggg actgagagac aggactagct ggatttccta ggctgactaa gaatccctaa 9600 
gcctagctgg gaaggtgacc acatccacct ttaaacacgg ggcttgcaac ttagctcaca 9660 
cctgaccaat cagagagctc actaaaatgc taattaggca aagacaggag gtaaagaaat 9720 
agccaatcat ctattgcctg agagcacagc aggagggaca atgatcggga tataaaccca 9780 
agtcttcgag ccggcaacgg caaccccctt tgggtcccct ccctttgtat gggagctctg 9840 
ttttcatgct atttcactct attaaatctt gcaactgcac tcttctggtc catgtttctt 9900 
acggcttgag ctgagctttc gctcgccatc caccactgct gtttgccgcc accgcagacc 9960 
cgccgctgac tcccatccct ctggatcatg cagggtgtcc gctgtgctcc tgatccagcg 10020 
aggcacccat tgccgctccc aatcgggcta aaggcttgcc attgttcctg catggctaag 10080 
tgcctgggtt catcctaatt gagctgaaca ctagtcactg ggttccatgg ttctcttctg 10140 
tgacccacag cttctaatag agctataaca ctcaccgcat ggcccaaggt tccattcctt 10200 
gaatccataa ggccaagaac cccaggtcag agaacacgag gcttgccacc atcttgggag 10260 
ctctgtgagc aaggaccccc aagtaacaca accatgaggg tgcaaatgca tgggccacta 10320 
atggtagagc aagaaaacag aagggccctg gttcctcgaa ggcatcagtg agctgaaatg 10380 
cctgccctgg atgtcctatt cctaggtgtt tttctgcctg aagcagatta aaccctttgt 10440 
tcacttctcc aagtagggct tctattacag cccaaatcaa tccccacccc agatgacat 10499 
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<210> 4 
<211> 2784 
<212> ADN 

<213> Homo sapiens 
<400> 4 

ctccttcagg agaacaaaga acaggccact acccaagaga agactggcaa ctagatttta 60 

cccatatgcc caaatctcag ggatttcagt atctactagt tcgggtagat actttcactg 120 

gttgggcaga ggccttcccc tgtaggacag aaaaggccca agaggtaata aacgttcatg 180 

aaataattcc cagattcgga cttccccaag gcttacagag tgacaatggc cctgctttca 240 

aggctacagt aacccaagga gtatcccagg tgttaggtat acaatatcac tcacactgcg 300 

cctggaggcc acagtcctca ggaaaggtgg agaaaatgaa caaaacactc aaatgacatc 360 

taaaaaagct aatccaggaa acccacctcg catggcctgc tctgttgcct atagccttac 420 

taagaatccg aaactctccc caaaaagcag gacttagtcc atacaaaatg ctgtatggac 4 80 

ggcccttcct aaccaatgaa cttgggcttg accgagagac agccaactta gttgcagaca 540 

tcatctcctt agccaaatat caacaggttc ttaaaacatt acagggagcc rgtccccaag 600 

aagagggaaa ggaactattc caccctggtg acatggtatt agtcaagtcc cttccctcta 660 

attccccatc cctagataca tcctgggaag gaaactaccc agccatttta tctaccctaa 720 

cggcagttaa agtggctgga gcggagtctt ggatacatca cactcaagtc aaaccctgga 780 

tactgccaaa ggaactcaaa aatccatgag acaatgctag ctattcctgt gaacctcrag 840 

aggatctgcg cctgctcttc aaatgacaac cagggggaaa gtaactaaaa tcgtaaarcc 900 

cctggccctc ccttatcata tttttctctt tactgt-ctc ttaccccctt tcac~ctcac 960 

tgcaccccgt ccatgccact gcaccccgtc catgccccgt ccatgccagt agctcccctt 1020 

agcaagagtt tctatggaga atgcagcgtc ccggaaatat tgatgcccca ttgtatagga 1080 

gtttatctaa gggaaccccc accttcactg cccacaccca tatgccccac aactgctata 1140 

actctgccac tctttgcatg catgcaaata ctcattattg gacaggaaaa acgattaatc 1200 

ccagttgtcc tggaggactt ggaggactca cttcactcat accagtatgt ctgatggggg 1260 

tggagttcaa gatcaggcaa cagaaaaaca cataaaggaa gtaatctccc aactgacctg 1320 

ggtacatagc acccctggcc cctacaaagg actagatctc tcaaaactac atgaaaccct 1380 

cc^&tacccat actggcctgg taagcctatt taataccacc ctgactgggc tccatgaggt 1440 

ctcggcccaa aaccctacta actgttggat gtgcctcccc ctgcacttta ggccatacat 1500 

ttcaatccct atacctgaac aatggaacaa cttcagcaca gaaataaaca ccacttctgt 1560 

tttagtaggt cctctttcca atctggaaat aacccatacc tcaaacctca cctgtgtaaa 1620 

atttagcaat actatagaca cagccaactc ccaatgcatc aggtgggtaa ctcctcccac 1680 

acgaatagtc tgcctaccct caggaatatt ttttgtctgt ggtacctcag cctatcattg 1740 

tttgaatggc tcttcagaat ctgtgtgctt cctctcattc ttagtggccc ctatgcccat 1800 

ctacactgaa caagatttat acaatcatgt catacctaag ccccgcaaca aaagagtacc 1860 

cattcttcct tttgttattg gagcaggagt gctaggcgga gtagctactg gcattggcgg 1920 

tatcacaacc tctactcagt tctactacaa actgtctcaa gaactaaatg gtgacatgga 1980 

atgggtcgct gataccctgg tcaccttgca agatcaactt aacrccctag cagcagtagt 2040 

ccttcaaaat cgaagagctt tagacttgct aaccgcggaa agcgggggaa cctttttatt 2100 

tttagaggaa aaatgctgtt gttatgttaa tcaatccgga atcatcaccg agaaagttaa 2160 

agaaattcaa ggtcgaatat aacgtagagc aaaggagctg caaaacactg gaccctgggg 2220 

cctcctcagc caatggatgc cctggattct ccccttctta ggacctctag cagctataat 2280 

attgttactc ctctttggac cctgtatctt taacctcctt gttaagtttg tcttttccag 2340 

aatcgaagca gtaaaactac aaatcgttct tcaaatggag ccccagatgc agtccatgag 2400 

taaaatctac cacggacccc tggaccggcc tgctagccca tgctctgatg ttaatgacat 24 60 

caaaggcacc cctcccgagg aaatctcaac tgcacaacct ctactacgcc ccaattcagc 2520 

aggaagcagt tagagtggtt gttggccaac ctccccaaca gcagttgggt tttcctgttg 2580 

agagggggga ctgagagaca ggaataacta gatttcctag accaactaag aatccctaag 2640 

actagctggg aaggtgaccg cttccacctt taaacaccgg gcttgcaact tagctcacgc 2700 

ccaaccaatc agatactaaa gagagctcac taaaatgcta attaggcaaa aacaggagat 2760 

aaagaaatag ccaatcatct gttg 2784 
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<210> 5 
<211> 1799 
<212> ADN 

<213> Homo sapiens 
<400> 5 

gggattctta gtcggcctag 
aggaaaaccc aagtgctgtt 
aattggggca tagtaggggt 
cattacaatt ggagcatggg 
tggacttcat ctggggttcc 
aagagacaaa cttaacaagg 
gagctgctag agatcctaag 
agggtccggt gtttttgaag 
actttctctg tgacaattca 
acataataac aacattcttc 
aagtctaaag ctcttcaatt 
aaggtgacca gggagtcggc 
tagtagaact gagtagaggt 
cctgctccga taacaaaagg 
taattgtata aatcttgttc 
acatagattc tgaagagcca 
ttcctgaggg taggcagact 
tggttgtgtc tacagtattg 
ccagattgga aacaagaggt 
tgttccattg ttcaggtaca 
accaacagtt agtagggttt 
ataggcttac caggcaagta 
ctttgtaggg gctaggggtg 
gtttttctct tgcctgatct 
aagtccgaca gacagtggct 
tccaataatg agtatttgca 
tatgggtgtg ggcagtgaag 
caatatttct gggaagccgc 
tacagcagca tggagggggt 
aaatatgata agggagggcc 



gaaatccagc taatcctgtc 
ggggaggttg gctgacgacc 
tgtgcagttg agatttcctc 
ctagtaggcc ggtccagggg 
atttgaagaa cgatttgtag 
aggttaaaga tacagggtcc 
aaggggagaa tccagggcat 
ctcctctgtt ctacgttgta 
ggattgatta acataataac 
ccctaaaaat aaacagcttc 
ttgaaggacc actgatgcta 
aacccattcc atgtcaccat 
tgtggtaccg ccaatgccag 
aagaatgagt actcttttgt 
agtgtaaatg gtcatggggg 
ttcaaacaac gataggctaa 
attcgtgtgg gaggagttac 
ctaaatttta cacaggtgag 
cctactaaaa cggaagtggt 
gggattgaaa tgcatggcct 
tggaccgaga cctcatggag 
tgggtatgga gggtttcatg 
ctatgtaccc gggtcagttg 
tgaactccac ccucctcaga 
ccaagtcttc caggacaact 
tgcatgcaaa gagtggcaga 
gtggagtttc ctttaggtaa 
attcttcata gaaactcttg 
gcagtgagag tgaaaggggg 
atggggattt acgattttag 



tctcagtccc cccact caac 60 
agtctaactg cttcctgcgc 120 
gggaggggtg cgttcgataz 180 
tccacggcag atcttagtca 240 
ctttacaact trgattctgg 300 
aaagaggag" a-caatar^a 360 
ccattggctg aggaggcccc 420 
ttcaatctcg aatttcrrca 480 
aacattcttc cgctaaaata 54C 
cccctctttc agaggttagc 600 
ggaagttaag ttgatcttgc 660 
tgagttcttg agatagtttg 720 
aacctagtcc acctagcact 780 
tgtggggctt aggtacaaca 840 
cactaagaat gagaggaagc 900 
ggtaccacag acaaaaaata 960 
ccacctgatg cattgggagt 1020 
gtttgaggta tgggttattt 1080 
gtttatttct gtgctgtagt 1140 
gaaatacagg gggaggcaca 1200 
cccagtgagg gtggtattaa 1260 
tagttttaag agatctagtc 1320 
ggaggttact tcctttacat 1380 
cataccagta tgggtgaagt 1440 
aggattaatc attttccctg 1500 
gttatagcag ttgtggggca 1560 
actcctattt gatggggcat 1620 
gtaaggggag ctgctggttg 1680 
taagagaaca gtaaagagaa 1740 
ttactttcct cacggttgt 1799 



<210> 6 
<211> 1489 
<212> ADN 

<213> Homo sapiens 
<400> 6 

tggtgcttgc cccgggcact ctcagtcctg 
ctcagaggac ctacgtcccc tggggcagtg 
gcatggacga gggggcggct tatttctatt 
accgcactgg aagcaaaccc tattaggcat 
gcctccaaag tccgcttgcc tgagggccat 
tttgtcccat tctgcctgct catcctgatc 
caatagggtt tctaagtttt gttccgggcc 
gtctgtagct gactgagtga taaacttatc 
agttgacaga gagaggtatg cttcctcaat 
ggattttctt cctttccctg tgttatagtg 
ctagttttcc ttagtccttc tagcacgcaa 
tgttctgatt ctgtgtccca gtgagggtct 
aatcgttctc tttcctctgt tgtcgaccta 
ccaaactctc aggctgcagt tacggcgaca 



ctgctggatc atctggttag tggcttctga 60 
ggccttacag tgattccctt gacacgaggt 120 
tggacaatct tttttaaagt gtccttgtag 180 
ttgatttgcc tagcttttcc cttttccagt 240 
gactaaagcg gtggcctttt ttttatccca 300 
tctattataa aaaactgagg ttgccaagtt 360 
taaggcagac ttttgaagtt ttttcctaat 420 
ctttaagatt agttggcctt cagtagagtc 480 
gcctccgtta gtcactccag aaaggcggta 540 
gacatcattg aataactcac aggcttcttt 600 
gttagcaaat gtctgcggca ccaatctcca 660 
acactgggaa ctgcctgctg gcctgtgggg 720 
tcattgacct gactgagata ccagagatcg 780 
cttctgtcat ttggggttag tgtctgattt 840 
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agcagtaaca ttatatctct ccatatcaga 

tcaatatagc cattagggtt atctgagaat 

ggagagaaaa aggcacatgc actctggctg 

agagagaaaa aggtacgtgc actctggctg 

ggcataatcg gggaatattg gcattctttg 

tttggaccgt ttgggttgaa ggggggtcct 

tggggtaggg aggtagactc tgagggcttc 

attgcgagtt gtctcttaat gaaaagaaag 

cttcttttct acaaaagagg tctagctgta 

gatgccaggt ttctccccct taaagagtat 

tgtctttttt ttcttagcat ctgagagtca 



8 

tcaaaggatt gtcctaaac" ttgtaaaaca 9CC 

ttacctaggt ctattttaat ttaaagtct? 96C 

ggccgaattc tcttcctccc actgcgtctg 1020 

ggccgaattc tcctcccacc gcttggaccg 1030 

gttagttgtt tacccctttg t ct a tctcct 1140 

tattatttgg ggaaggagtc tgggggatgc 120C 

ctgtagggca taaatcacac tttttacata 1260 

tttgtacgta tgacacttca caccatttgc 1320 

agatggtgtt ataatttatg cttccctcac 1330 

atcgttgcca ggcggtactg cagaagaata 1440 

aattggtccc aattctcca 1439 



<210> ? 
<211> 1216 
<212> ADN 

<213> Homo sapiens 
<400> 7 

taaagataca gggattgaaa tgtatggcct 
gaaaatgggg tttcctttag aaaaactcct 
ccgcattctc catagaagct cttggtaatg 
gggtgcagtg agagtgaaag agggtaaaag 
gggttcagtg agagtgaaag ggggtaagag 
gccatgagga tctacgattc tagttacttt 
agatcctcta gaggttcaca ggaatagcta 
ggcagtatac agagtttgac tcgagtgtga 
accgcagttg gggtagataa aatgactggg 
ggggacttag aaggaaggga cttgactaat 
ccctcttctc gggaacaggt tccctgtaat 
gaggtgatgt ctgcaactaa gctggccatc 
aagggccatc catacagcat tttgtatggg 
attcttagta aggctgtagg caacagagca 
ttttttaaat gtcgtttgag tgcttcattc 
ctccacgcgc agtgtaagtg atattgtatg 
gtagccttga aaacggggcc attgtcactc 
attatttcat gaattagtgc ctttattaca 
gcctctgccc aaccagtgaa aatatctacc 
ttgggcatgt gggtaaaatc tagttgccag 
tctcctgaag gagctt 



gaagtgcagg gtcatatagc tgtgggtggt 60 
atacgatggg tcatcaatat ttccaggaag 120 
ggagctactg gtagtacagt ggcatggagg 180 
aacagtaaag agaaaaatat gataagggag 240 
aacagtaaag aaaaaaatat gacaaggagg 300 
cctcacggtt gtcgcttgaa gagcaggtgc 360 
gcgttgtctc ctggattttc gggttccttt 420 
tgtattcaag actccactcc agccacttta 480 
tagggtcctt cccaggatgt atctaaggat 540 
accatgtcac cagggtgcaa taattacttt 600 
gttttaagaa cttgttgata tttggccaag 660 
tctcggtcaa gcacaaggtc cttggttagg 720 
ctaagtcctg ctttttgggg agagttttgg 780 
ggccatgcaa ggtgggtttc ttgggttagc 840 
attttcttga cttttcctga ggattgtggc 900 
cctaatgcct gggatactcc ctgggttact 960 
tgtaagcctc ggggaagtcc gaatctggga 1020 
tcttggtcct tttctgtcct acaaaggaag 1080 
cagactagta gatactgaaa tccctgagat 1140 
tcttctcctg agtaatggcc tgttctttgt 1200 

1216 



<210> 8 
<211> 976 
<212> ADN 

<213> Homo sapiens 
<400> 8 

agtgataatg gaatacttga aagtaatccc 
aaactaatag ccctcactcg ggcactagaa 
acagactata agtatgctta cctagtcctt 
gaattcctaa cttccaaagg aacacctatc 
ttggtggtac agaaacctaa agaggtggca 
aaggaaaggg aaatagaagg gaactaccaa 
caggaccctc cattagaaat gcttatagaa 
gaaagcaatc cccagtactc agcaggagaa 
ttcctcccct caggatggct agccaccaaa 
caatggaaat tacttaaaac ccttcaccaa 



ctcactccag gaactagtgc tgagctggcc 60 
ttaggagaag agaaaagggt aaatatatat 120 
catgcccatg cagcaatatg gagagaaagg 180 
aaacatcagg aagccattag gatattatta 240 
gtcctacact gctggggtca tcagaaaaaa 300 
gcagatattg aagccaaaag agccgcaagg 360 
ggacccctag tgtggggtaa ccccctccag 420 
ataaaatgga gaacctcacg aggacatact 480 
gaaggaaaaa tgcttttgcc tgcagctaac 540 
acctttcact taggattgat agcacccatc 600 
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agatggccaa attattattt actggatcag gccttttcaa aactatcaag caggtagtca 660 

gggcctgtaa agtgtgccaa agaaataatc tcctgcacrg caagccacac atttcaaccc 720 

ctgtaccttt aacctccttg ttaagtttgt crctcccaga atcaaagctg caaaacraca 780 

aatggttctt caaatggagt ctcagatgca gtccatgact aagatatac^ gcagcccccr 840 

ggagggggcc tgctagccca tgctccaatg ttaatgacat cgaaggcacc cctcccgggc 900 

aaatctcaac tgcacaaccc ctactatgtc ccaattcagc aggaagcagt taaagcggcc 960 

atcggccaac ctcccc 976 



<210> 9 
<211> 942 
<212> ADN 

<213> Homo sapiens 
<400> 9 

agaggagaac agcagcataa gcggctggca 
agagaaagag aaagagaaag tcagagaaag 
aaagtcaaag aggtagtagt cagaaacaga 
gacacagaaa gtcaaaaaaa aagttaagaa 
ggagaaagag agagatagaa gtagtaaaga 
cagggtaaat ttctatctac ccagccaagg 
tatctgcctc tcagacagtt tgcaagaaat 
aatagactct ttggcagcag tgactctcca 
tgaaaaagga ggacactaca ccttcttagg 
ggggatagta tgagatgctg cccggagttt 
cctttcaaat tcttatacca acttctggag 
tcctgtggca gccatcttgc tgttactcgc 
caaatttgtt tcctctagaa tcgaggccat 
ccaaaagagt tcaactaaca acttctaccg 
ccctggccta gagagttccc ctctgaagga 
atccagcagg agtagctaga gtggtcatcg 



gaggtaggga aagaccagca agaagaaaag 60 
agacagagag aggaagagac aaagagacag 120 
gacaaaaaaa aggagtcaga aagagggaca 180 
gaaaggaaaa gacaaagaag aagtcgaaga 240 
aaaaaacagc atatcccatt cctttaaagc 300 
catattctac ttatgtggan cttcaaccca 360 
aatgaaatct atccttactt tacaatccca 420 
aaactgcaga ggcctagacc tcctcactgc 480 
ggaagaatgt tgtttttaca ctaaccagtc 540 
acaggaaaag gcttctgaaa tcagacaacg 600 
ttaggcaaca tggcttctcc cctttctagg 660 
ctttgggccc tgtatttcta accttcttg- 720 
caagctacag atggtcttac aaatggaacc 780 
aggacccctg gatcaaccca ctggcacttc 840 
caccgcaact , gj»gggccct tctttgcccc 900 
gccaaattgc ca 942 



<210> 10 
<211> 1375 
<212> ADN 

<213> Homo sapiens 
<400> 10 

ccccaatatt ctctttctga tggggaaaaa 
actatcctgc agcttgatct tttctgtaag 
gtccaagctt tcttttcatt gagggagaat 
cccacaggag gacccctcag cttaccccca 
attgatgata ctcctcctct aatctcccct 
aaaggtccac aaaaaccccc gggctatcgg 
gaatttggcc caacccgggt gcatgtcccc 
cagacctggg gaagttttca gatgatcctg 
ggcaaacctt tgacctcact tggagagacg 
ttaatgaaaa gaatgcggct ttagctgcag 
gtcaagtaaa tgaaagaatg acagccgaag 
ccatccccag tatggatccc cactgggact 
aacatctgtt gatctgtgtt ctggaaggac 
attcaatgat atccaccata acccagggaa 
ggctacaaga ggccttaaga aaatatactc 
tgattctaaa agataagttt attacccaat 
agcaagccct gagccctgaa caaaatctag 
tctataatag ggaccaagag gaacaggccc 
cagccttagt catggccctc agacaaacaa 



tggccacctg agggaagcac aaattacaat 60 

agggaaggca aatggagtga aataccttat 120 

acacaactat gcaaagcttg caatttacat 180 

tatcctagcc tccctatagc ttcccttcct 240 

gcccagaagg aaataagcaa agaaatctcc 300 

ttatgtcccc ttcaagctgt agggggaggg 360 

ttctccctct ctgatttaaa gcagatcagg 420 

ataggtacat agatgtccta cagggtctag 480 

tcatgctact gttagatcaa accctggcct 540 

cctgagagtt tggagatacc tggtatccta 600 

aaagggacaa cttccctact ggtcagcaag 660 

ttgactcaga tcatggggac tggagtcgta 720 

taaggagaat tgggaaaaag cccatgaatt 780 

aggaagaaaa tccttctgcc ttcctcgagc 840 

ccctgtcacc cgaatcactc gagggtcaat 900 

cagccacaga tatcaggaga aagctccaaa 960 

agacattatt aaacctggca accttggtgt 1020 

aaaaggaaaa gcgagatcag agaaaggccg 1080 

accttggtgg ttcagagagg tcagaaaatg 1140 
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gagcaggcca atcacctggt acggcttgtt 

aagatcgtcc aataagaaac aagctgcccc 

actggaaggt gcactgcccc agaggatgaa 

tgatccaaca acaggactga gggtgcccgg 



10 

atcagtgcgg tttactagga cacrttaaaa 1200 

ctcatccgtg tccactatgc cgaggcaacc 1260 

ggttccctgg gttagaagcc cccaaccaca 1320 

ggcaagcacc agctcatgtc atcac 1375 



<210> 11 
<211> 944 
<212> ADN 

<213> Homo sapiens 
<400> 11 

acctaggagg aactgtcttc aggacaggac 
aaaaagacac aatgggtatt cagtaagtga 
aaaattgcct aataattggt ctgctcaaat 
aaaagtatta cagaatcagg aagaagccat 
acgagaactt attaatagca aagaataatt 
aagcacagtt tgctaaaagt taactgtgta 
aaatgatttc tcagacagtt tgcaagaaac 
aatagactct ttggcagcag tgactctcca 
tgagaaagga ggactctgca ccttcttagg 
agggatagtg tgagatgcca cccagcgttt 
tgcttttcaa accttatagc aacctctgga 
tcctgtgaca gccatcttgc tattactcgc 
caaatttgtt tcctctagga tcgaggccat 
ccaaatgagc tcgactaaca acttctactg 
aactggctta aagagtttcc ctctggagga 
catccacagg aagttagcta gagcagtcat 



tatagatgct tcctcccagg cgattaaggg 60 
taaggaaact cttgtagaag cagagttagg 120 
gtgcgagctg ttt'gcactca gccaaacctt 180 
ctataccaat tctaagrcaa tatggactga 240 
gaaatcccaa acttacaagg ttttcaacaa 300 
acatgtatta tcctactacc acaaactctc 360 
aacgaaacct acccttactc tacaatccca 420 
aaaccaccaa ggcctagacc tcczcactqc 480 
ggaagattgt tgrttttaca ctaaccagtc 540 
acaggaaaag gcttctgaaa tcagacacaa 600 
gttcggcgac tggcttttcc cctttctagg 660 
cttcgggccc tgtattttca acctcctcgt 720 
caagctacag atggtcttac aaatggaacc 780 
aggacccctg gaccgaccca ccggccctrt 840 
cactacaact gcagggcccc ttctttgccc 900 
cacccaattc ccaa 944 



<210> 12 
<211> 963 
<212> ADN 

<213> Homo sapiens 
<400> 12 

tacaggaacc ccataatacg tccttggcaa 
cccatttgtc ctgaaccctc aaatcatggg 
ccttatgagt tttcagctac aggggtgtat 
tggaagatcc ttctatattt gcctccccac 
catagtacct cctgtgactt atccttttca 
aagcttcagc cgagagcaat ctcactactt 
acctaggaag tggactcaca gcctagatga 
ccaaatagac tcattagcag ctgtggttct 
cctcactgcc gaaaggggag gaacatgcct 
caataaatca ggcatagtga gagatggaat 
acatggtggg acaaccgaaa ctacctcagg 
tccattttta ggtcccttcc ttatgattat 
cagttccttc atcctttcgt ttcttcctga 
cagatggaac ctcagatgac ttcaaccagc 
gccggcccat acccggacgt tgacacccaa 
gaaccccttc tatgccccta ttcagcagga 
caa 



attctattca gctccaactg ctaggagtgg 60 
aatgagaaat gaatttagac tgaccacagc 120 
agaaccctga taaggagttt tctttgtgtg 180 
caactggaca ggaacttgta cttcagccta 240 
gaagaggcag tagctgtgcc cattcatgct 300 
cctctattgg ctggtttagg atttactacc 360 
aatctctctc caacttactc aaatccagga 420 
ccgaaccagt gagcactaga tctccaatct 480 
ttttctgaac aaggaatgtt gtttttatgt 540 
taaatgactt caggatagag ctagcagact 600 
gttctcacag cctgttctcc actggcttct 660 
tctaggagta acctttggcc catgtctttt 720 
atagaatcaa tgaaactaga aatgttactg 780 
acctattatc aaggacccct aaaccagcct 840 
accacctctc acgaggaaac ctcagctaca 900 
agcaattaga gtggtcatcc tcccacaccc 960 

963 
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<210> 13 
<211> 1362 
<212> ADN 

<213> Homo sapiens 
<400> 13 

ccacaatatc ctcttccagg aggagaacga tggccacctg agggaagtat acactataat 60 
accatcctgc aactagatct gttttgtaaa caagaaggca agtggattta ggtaccatat 120 
gttcagacct ttttctcatt aagggatgat aacccacgat tgtgtaagac atgtaacctg 180 
caccccacag ggagtcctca aattctaccc ccatacccag tcctccccac ggctcctcct 240 
actaatgcca aaccctctct ggcttctaca gcccaaaagg gaacaaaraa aagagccrtc 300 
agagagccaa gagaccccac tggcccctgg ctatgtcccc ttcaggctgt aggaggggaa 360 
tttggcccaa cccgagtaca tgttcccttt tctctctctg atctaaagca aattaaggca 420 
gacttggatg aaagttctca gatgacccca atagatacgt agatggcctg ctgggtctgg 480 
gacaatcttt tgacctttcc tggagagaga tcatgttatt gcttgatcag acctaacctc 540 
taatgagaag aatgctgctt taacaggagc ccgagagttt ggggatacct ggtacc-cag 600 
ttaagtaagt gatagaatga catcagaaga gagcagtttc ctactggcca gcaagcag-c 660 
cccagtatgg atccccactg ggaccctgac tcggatcatg gggactggag ccacaaacat 720 
ttactgacct gtatcctaga agggttaagg agaactagga aaaagcccat gaactattca 780 
atgatgtcta ctataaccca agggaaggaa gaaaacccta ttgccttcct caaaaggctg 840 
agggaggctt tgagaaaata tactcccctg tcaccagatt ccctcgaagg ccagttaatt 900 
ttaaaggaca aatttattac tcagtcagct gcagacatta ggaaaaagct ccaaaagtra 960 
gccttgggcc gagcaaaatt tggaggcatc attaaacctg gcaacctcag tgttctatca 1020 
tagggaccaa gaggaacagg ccgaaaagga aaagcaggat aagagaaagg ctgcagatti 1080 
agtcatgccc tcagacaaac cttggcggtt caaagaggag aaaaaatgga gcaggccaac 1140 
cacccagcag ggcttattat cagtgcagtt tacaaggaca ctttaaacaa gattgtccaa 1200 
agagaaataa gccgccctct cacccatgtc cactatgcca aggtgatcac tggaaggcac 1260 
actgtcccag aggacaaagg ttctctgggc cagaagtccc caaccagatg atccagcaac 1320 
aggatggagg gtgcccgggg caagcaccag ctcgtgttgt ca 1362 



<210> 14 
<211> 945 
<212> ADN 

<213> Homo sapiens 
<400> 14 

ttgcagatca atctcagact gctgtgctag caatgagtga ggcttcgtgg gcatgggacc 60 
ctctgagcca ggcatgggat ataatgtcct tgtgtgccat ttgctaagac tgttggaata 120 
gcacagtatt agggtgggag tggcccgatt ttccaggtgc tgtctgtcac cgcttccctt 180 
ggctaggaaa gagaattccc tgaccccttg ttcttcccag gtaaggcagt gcctcaccct 240 
gcttcagctc acactcaggt gactgcaccc actgtcctgc ccccactgtc ggacaagccc 300 
cagtgagatg aacctggtac ctcagttgga aatgcagaaa tcacctgtct tctgcgtcac 360 
tcacactggg agctgtagac tggagctgtt cctatttggc catcttggaa ccatctccca 420 
aatagactct ttggcagcag tgactctcca aaaccaccaa ggcctagacc tcctcattgc 4 80 
tgagaaagga ggactctgca ccttcttagg ggaggagtgt tgtttttata ctgaccagtc 540 
agggatggta cgagatgcca cccgatgttt acaggaaaag gcttctgaaa tcacacaaca 600 
cctttcaaac tcttatacca acctctggag ttgggcaaca tggcttctcc cctttctcgg 660 
tcccattgca gccatcttgc tattactcgc cttcaggctg tgtattttta acctccttgt 720 
caaatttgtt tcctctagaa ttgaggccgt caagctacag atggtcttac aaatgggacc 780 
ccaaatgagc tcaactaaca acttctgcca aggacccctg gaccaacctg ctggcccttt 840 
cactggcctt aagagttccc ctctggaggg cactacaact gcagggcccc ttctttgccc 900 
ctatccagca ggaagtagct agagcagtca tcacccaatt cccaa 945 



WO 99/67395 



PCT/FR99/01513 



<210> 15 
<211> 939 
<212> ADN 

<213> Homo sapiens 
<400> 15 

agagctacct tggcaagtac tctaggagta 
cattttaaca tacacaatca ggtctgccca 
catcgaccta tatctgcctc cccactaact 
gtcccaacag taacattgcc ccaggaaatc 
tctgtcagtg cagagccata caactaatac 
ctacaggaac cagaatagct agtttgttta 
atgatttctc agacagtttg caagaaataa 
tagactcctt ggcagcagtg accctccaaa 
agaaaggagg actctgcatt ttcttagggg 
cagtatgaga tgccactcgg agtttacagg 
caaactctat accaaactct ggagttgggc 
gacagccatc ttgctattat ttgcctttga 
tgtttcctct ggatcgaggc catcgagcta 
gagctcaact aacaacttct actgaggacc 
cctgaagaat tcccctctgg aggacactac 
agcaggaagt agctagagct gtcattgcct 



tgggaaaatg aaaacaacaa actcacacac 60 
cccagcaagg tatattcttt gcatgtggaa 120 
agacagccac crgaatctta gtctttctaa 130 
agaccatatc agtaiccctc aaagctcaar 240 
ccctacttat agggtaagga atggctactg 300 
cttcattatc ctactaccac acactctcaa 360 
cgaaatctat ccttactcta caatcccaaa 420 
acggctgagg cctagacctc ctcaccgcca 480 
aagagtgttt ttacactaac cagtcaggga 540 
aaaaggcttc tgaagtcaga caatgccttt 600 
aacatggctr ctccccttrc taggtcccgz 660 
gccctgtatt tttaatctcc ctttcaaat. 720 
cagatggtct tcacaaatgg aaccccaaa: 780 
cctggactaa cctgccgacc ctttcactcg 340 
aactgcaggg ctccttcttt gccccratcc 900 
aattcctaa 939 



<210> 16 
<211> 979 
<212> ADN 

<213> Homo sapiens 
<400> 16 

agtgataatg gaatacttga aagtaatccc 
cagaactaat agccctcact cgggtactag 
atacagactc taagtgtgct tacctagtcc 
gggaattcct aacttccgag ggaacaccta 
tattggctgt acagaaacct aaagaggtgg 
gaaaggaaag ggaaatacaa gggagccacc 
ggctggaccc tccattagaa atgcttatag 
gggaagccaa gccccagtac tcagcaggag 
cttccctccc ctccagatgg ctagccacca 
accaatagaa attacttaaa acccttcatc 
atgagatggc caaattatta tttactggac 
tcagggcctg taaagtctgc caaagaaata 
tccctgtatc tttaacctcc ttcttaaatt 
acaaatagtt cttcaaatgg agccacagat 
cctggaccag cctgctagcc catgctccaa 
aggaaatctc aactgcacaa cccctactac 
gtcatcagcc aacctcccc 



ctcactcccc aggaactag- gctcagctgg 60 
aatcaggaga aggaaaaagg gtaaatatat 120 
tccatgccca tgcagcaata tggagagaaa 180 
tcaaacatca ggaagccatt aggaaattat 240 
cagttttaca ctgccggggt catcagaaag 300 
aagttgatat tgaagtcaaa agagccacaa 360 
gaggacccct agtatggggt aatcccctcc 420 
aaatagaata gggaacttca tgaggacata 480 
ataaaggaaa aatacttttg cctgcagcta 540 
aaaccttcca cttaggcatt gatagcaccc 600 
caggcctttt caaaactatc aagcagatag 660 
atcccctgca ctgcaggcca tacatttcaa 720 
tgtctcttcc agaatcaaag ctgtaaaatt 780 
gcagtccatg actaagatcc accacagacc 840 
tgttaatgac atcgaaggca ccccctcctg 900 
gccccaattc agcagaaagc agttagagtg 960 

979 



<210> 17 
<211> 1774 
<212> ADN 

<213> Homo sapiens 
<400> 17 

catgctggta aaggaccgct agaatccagc 
aggtgggaaa acaggtgcag gactgctaca 
ggtccatggg tggttacgca ccctggaaag 



agccaggacc actttctttg tggtcaagaa 60 
ctggtaagca taactaatcc gataagcaga 120 
gaataagcat taggactata gaggacactc 180 
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taggactaat gctcatcgga aaatgactag gggtactggc atcc—atg: scttttttca 240 

gatgggaaat gttcccccca aggcagaaat gcccctaaga tgtattctcg agaaatggga 300 

ccaatctgac catcagacac taagaaagaa acgacttata cucttctgca gtaccacctg 360 

gccacaatat ctrcttcaag gggcagaaac ctggcctcct gagggaag^a taaattataa 420 

caccatctta cagctagacc tcttttgtag aaaagaaggc aaatggagcg aagtgccaca 480 

tgtacaaact ttcttttcat taagagataa ctcccaatta tgtaaaaagc gtgatttacg 540 

ccctacagga agccctcaga gtctacctcc cgaccccagc aagaccccaa ctccttctcc 600 

aactaataag gacccccctt caacccaaat ggtccaaaag gagatagaca aaggggtaaa 660 

caatgaacca aagagtgcca atattacacg attatactcg ctccaagcag tgggaggaga 720 

atttggccca gccagcgtgc atgtaccttt ttctctctca gatttaaagc aaattaaaat 730 

agacctaggt aaattctcag ataaccctga cggctatatt gatgttttac aagggttagg 840 

acaatccttt gatctgacat ggagagatat aatgttactg ctaaatcaga cactaacccc 900 

aaatgaaaaa agtgctgcca taacagcagc ctgagagttt ggcgaactct ggtatctcag 960 

tcaggtcaat gataggatga caacagatga aagagaatga ttccccacag gccagcaggc 1020 

agttcccagt gtagaccctc attaggacac agaatcagaa crtggagatt ggtgccacag 1080 

acatttgcta acttgcgtgc tagaaggact aaggaaaact aggaagaagc ccatgaatta 1140 

ttcaatgatg tcccctataa cacagggaaa ggaagaaaat cctactgcc- ttctggagag 1200 

actaagggaa ggattgagga agcatacctc cctgtcacct gactctatta aaggccaact 1260 

aatcttaaag gataagttta tcactcagtc agctgcagag atcaagaaaa aacttcaaaa 1320 

gtatgcctta ggcccagagc aaaacttaga aaccctactg aacttggcaa cctcagtttt 1380 

ttataataga gatcaggaag agcaggggaa tgggacaaat gggataaaaa aaaaaaaaaa 1440 

aggtgactgc tttagtcgtg gccctcaggc aaatggacct tggaggctcc agaaaaggga 1500 

aaagctgagc aaattgaatg cctaacaggg cttgcttcta gtgtggtcra caaggacact 1560 

ttaaaaaaga ttgtccaagt agaaacaagc tgcccccttg tccatgcccc ttatgtcaag 1620 

ggaatcactg gaaggcccac tgccccagga gatgaaggtc ctctgagtca gaagccacta 1680 

accagataat ccagcagcag gactgaggat gcccagggca agcgccagcc catgccatca 174 0 

ccctcacaga gccttgggta tgcttgacca ttga 1774 

<210> 18 
<211> 938 
<212> ADN 

<213> Homo sapiens 
<400> 18 

tgtaggaaga actcccttca ggacaggaca atagatggtt cctcccaggi gattaaggaa 60 

aaaagacaca gtattcagta agtgataagg aaactcttgt agaagcagag ttagaaaaat 120 

tgcctaataa ttggtctgct caaatgtgtg agttgtttgc actcagccaa atcttaaagt 180 

acttacagaa tcaggaagca gccatctata ccaattctaa gttaatatgg actaaacgag 240 

gttttattag tagcaaagaa aaattaaaat cccaaactta caaggttttc aactaaagtt 300 

tgccaaaagt taacagtgta acatgtatta tcctactatc acacactctc aaaggatttc 360 

tcagacagtt tgcaagaaat aacgtaatct atccttactc tacagtccca aatagactct 420 

ttggtagcag tgactctcca aaactgccga ggtctagacc tcctcaatgc tgagaaagga 4 80 

gaactctgca ccttcttagg ggaagagtgc tgtttttaca ctaaccagtc agggatagta 540 

tgagatactg cctgacgttt acaggaaaag gcttctgaaa tcagacaacg cctttcaagc 600 

tcttatacca acctctggag ttgggcaaca tggcttctcc ccttgctagg tcctgtggca 660 

gccatcttgc tattacttgc cttcgggccc tgtattttta acctccttgt caaatttgtt 720 

tcctctagga tcaaggccat caagctacag atggtcttac aaatggaacc ccaaatgagc 780 

tcaactaaca acttctactg aggacacctg gactgaccca ctggcccttt cactggccta 840 

aagagttccc ttctggagga cactacaact gcagggcccc gtcttcaccc ctatccagca 900 

ggaagtagct agatcagtca ttgcccaatt cccaacag 938 

<210> 19 
<211> 1308 
<212> ADN 

<213> Homo sapiens 
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<400> 19 

gatgcttgcc ccaggcaccc tcagtcctgt 
ccaaagaacc tttgtcctct gaggcagtgc 
catgggcaag ggggcagctt gtttctcact 
ccacactggt aacaagccct accaggtgat 
ccaccaaggt ttgtctgtct gagggtcatg 
ttttcctttt tggcctgttc ctcttggtac 
aacaatggct ccagattttg ttcagggcac 
ctgcagctga ttgggtaata aacttatctt 
gtgacagggg agtatatttc cttgaggcct 
tttcttcctt tccctgagtt ataaaagaca 
ttctccgtag tccttctaga acacaggtca 
ctgagtctag acaccagtgg ggatccatac 
tgtccctttc tttggctgtc attctatcat 
attctcaggc tgcagctaaa gctgcattct 
gcatgacatc tctccaagtg aggtcaaagg 
ggagaagggg acatacacct gagttagcca 
cataagcaat agcctgggga tttttgtggt 
tgggtggggg agattagagg aggcttatca 
ggatatgggg gtaagctgag aggtcatctt 
tgtggatttt ccttacaatg aaaataaagc 
ttccctctta cagaaaaggt caagctgcag 
tggccatttc ttcccatcag agagagaata 



tgttggatca tctggtcggg ggcttctggc 60 
accttccagt gattgcctca gcattgtgga 120 
ggacaatctt ttttaaggtg tccttccaaa 180 
tggcctgctc tattttctgz cctctctgaa 240 
actaaggctg tggccttrct ctgatcttgc 300 
ctattataga acactgaggt tgccaggttt 360 
agggctcatt ttggagcttt ctcctgatat 420 
ttaggatcaa ttgactctca agagagttgg 480 
cccatagccg ctctaggaag gcagaaggat 540 
tcattgaaca acrcatggac tttttcccaa 600 
gcagatgttt acgactccag tccccatgat 660 
tggggatggc ctgctgactg gtagggaatt 720 
ttacttgact aagataccaa gtatctccaa 780 
tttcattaaa ggccagggtt tgatctaata 840 
tttgccctag atccatagga catcagagaa 900 
aattcccctc cctctacagc ttgaagggga 960 
cctttggaga tttctttgct tgtttccttc 1020 
gtaataggaa ggggagctat agggaggcta 1080 
gtgggatgta aactgcaagc tttgcatagt 1140 
ttggacataa ggtatctcac tccatttgcc 1200 
gatagtactg taatttatac tcccttcagg 1260 
ctggggctgg gccatagt 1308 



<210> 20 
<211> 711 
<212> ADN 

<213> Komo sapiens 
<400> 20 

actgagagac aggactagct ggatttccta 
gaaggtgacc acgtccacct ttaaacacgg 
cagagagctc actaaaatgc taattaggca 
ctattgcctg agagcacagc aggagggaca 
ctggcaacag cagcccccct ttgggtccct 
tttcactcta ttaaatcttg eaactgcact 
tgagcttttg ctcaccgtcc accactgctg 
cccatccctc tggatcctgc agggtgtccg 
gccgctccca attgggctaa aggcttgcca 
gttctaattg agctgaacac tagtcactgg 
ttctaataga actataacac ttaccacatg 
ggccaagaac tccaggtcag agaatacgag 



ggccgactaa gaatccctaa gcctagctgg 60 
ggcttgcaac ttagctcaca cctgaccaat 120 
aagacaggag gtaaagaaat agccaatcat 180 
acaatcggga tataaaccca ggcattcgag 240 
tccctttgta tgggagctgt tttcatgcta 300 
cttctggtcc atgtttctta cggctcgagc 360 
tttgccacca ccgcagacct gccgctgact 420 
ctgtgctcct gatccagcga ggcgcccatt 4 80 
ttgttcctgc acggctaagt gcctgggttt 540 
gttccatggt tctcttctgt gacccacggc 600 
gcccaagatt ccattccttg gaatccgtga 660 
gcttgccacc atcttggaag c 711 



<210> 21 

<211> 711 

<212> ADN 

<213> Homo sapiens 

<400> 21 

actgagagac aggactagct ggatttccta 
gaaggtgacc acatccacct ttaaacacgg 
cagagagctc actaaaatgc taattaggca 
ctattgcctg agagcacagc aggagggaca 
ccggcaacgg caaccccctt tgggtcccct 
atttcactct attaaatctt gcaactgcac 
ctgagctttc gctcgccatc caccactgct 



ggctgactaa gaatccctaa gcctagctgg 60 
ggcttgcaac ttagctcaca cctgaccaat 120 
aagacaggag gtaaagaaat agccaatcat 180 
atgatcggga tataaaccca agtcttcgag 240 
ccctttgtat gggagctctg ttttcatgct 300 
tcttctggtc catgtttctt acggcttgag 360 
gtttgccgcc accgcagacc cgccgctgac 4 20 



WO 99/67395 



PCT/FR99/01513 



15 



tcccatccct ctggatcatg cagggtgtcc gctgtgctcc tgatccagcg aggcacccat 480 

tgccgccccc aatcgggcta aaggcttgcc attgttcctg catggctaag tgcctgggtt 540 

catcctaatt gagctgaaca ctagtcactg ggttccatgg ttctcttctg tgacccacag 600 

cttctaatag agctataaca ctcaccgcat ggcccaaggt tccattcctt gaatccataa 660 

ggccaagaac cccaggtcag agaacacgag gcttgccacc atcttgggag c 711 



<210> 22 
<211> 2055 
<212> ADN 

<213> Homo sapiens 

<220> 

<221> CDS 

<222> (1) . . (2055) 

<400> 22 

ccc aag aca gcc aac tta gtt gca gac ate acc tec tta gec aaa tat 48 

Pro Lys Thr Ala Asn Leu Val Ala Asp He Thr Ser Leu Ala Lys Tyr 
15 10 15 

caa caa gtt ctt aaa aca tta caa gga acc tat ccc tga gaa gag gga 96 
Gin Gin Val Leu Lys Thr Leu Gin Gly Thr Tyr Pro Glu Glu Gly 

20 25 30 

aaa gaa eta ttc cac cct tgt gac atg gta tta gtc aag tec ctt ccc 144 
Lys Glu Leu Phe His Pro Cys Asp Met Val Leu Val Lys Ser Leu Pro 
35 40 45 

tct aat tec cca tec eta gat aca tec tgg gaa gga ccc tac cca gtc 192 
Ser Asn Ser Pro Ser Leu Asp Thr Ser Trp Glu Gly Pro Tyr Pro Val 
50 55 60 

att tta tct acc cca act gcg gtt aaa gtg get gga gtg gag tct tgg 240 
He Leu Ser Thr Pro Thr Ala Val Lys Val Ala Gly Val Glu Ser Trp 
65 70 75 80 

ata cat cac act tga gtc aaa tec tgg ata ctg cca aag gaa cct gaa 288 
He His His Thr Val Lys Ser Trp He Leu Pro Lys Glu Pro Glu 

85 90 95 

aat cca gga gac aac get age tat tec tgt gaa cct eta gag gat ttg 336 
Asn Pro Gly Asp Asn Ala Ser Tyr Ser Cys Glu Pro Leu Glu Asp Leu 
100 105 110 

cgc ctg etc ttc aaa caa caa cca gga gga aag taa eta aaa tea taa 384 
Arg Leu Leu Phe Lys Gin Gin Pro Gly Gly Lys Leu Lys Ser 
115 120 125 

ate ccc atg gcc etc cct tat cat att ttt etc ttt act gtt ctt tta 432 
He Pro Met Ala Leu Pro Tyr His He Phe Leu Phe Thr Val Leu Leu 
130 135 140 

ccc tct ttc act etc act gca ccc cct cca tgc cgc tgt atg acc agt 480 
Pro Ser Phe Thr Leu Thr Ala Pro Pro Pro Cys Arg Cys Met Thr Ser 
145 150 155 160 
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age tec cct tac caa gag ttt eta tgg aga atg cag cgt cee gga aaz 
Ser Ser Pro Tyr Gin Glu Phe Leu Trp Arg Met Gin Arg Pro Gly Asn 
165 HO 175 

att gat gec cca teg tat agg agt ctt tct aag gga ace ccc acc ttc 
tu Aso Ala Pro Ser Tyr Arg Ser Leu Ser Lys Gly Thr Pro Thr Phe 



He Asp Ala Pro Ser Tyr Arg 
180 



185 190 



195 



523 



576 



act gec cac acc cat atg ccc cgc aac tgc tat cac tct gee act ctt 624 
Thr Ala His Thr His Met Pro Arg Asn Cys Tyr His Ser Axa Thr i,eu 

200 205 



672 



720 



768 



816 



864 



tqc atg cat gca aat act cat tat tgg aca gga aaa atg att aat cct 
Cys Met His Ala Asn Thr His Tyr Trp Thr Gly Lys Met He Asn Pro 
V 210 215 220 

aqt tgt cct gga gga ctt gga gtc act gtc tgt tgg act tac ttc ace 
Ser Cys Pro Gly Gly Leu Gly Val Thr Val Cys Trp Thr Tyr Phe Thr 
225 230 235 240 

caa act ggt atg tct gat ggg ggt gga gtt caa gat cag gca aga gaa 
Gin Thr Gly Met Ser Asp Gly Gly Gly Val Gin Asp Gin Aia Arg Glu 
245 250 255 

aaa cat gta aaa gaa gta ate tec caa etc acc egg gta cat ggc acc 
Lvs His Val Lys Glu Val He Ser Gin Leu Thr Arg Val His Gly Thr 
260 265 270 

tct age ccc tac aaa gga eta gat etc tea aaa eta cat gaa acc etc 
Ser Ser Pro Tyr Lys Gly Leu Asp Leu Ser Lys Leu His Glu Thr Leu 
275 280 285 

cgt acc cat act cgc ctg gta age eta ttt aat acc acc etc act ggg 912 
Arg Thr His Thr Arg Leu Val Ser Leu Phe Asn Thr Thr Leu Thr Gly 
290 295 300 

etc cat gag gtc teg gec caa aac cct act aac tgt tgg ata tgc etc 
Leu His Glu Val Ser Ala Gin Asn Pro Thr Asn Cys Trp lie Cys Leu 
305 310 315 320 

ccc ctg aac ttc agg cca tat gtt tea ate cct gta cct gaa caa tgg 
Pro Leu Asn Phe Arg Pro Tyr Val Ser He Pro Val Pro Glu Gin Trp 
325 330 335 

aac aac ttc age aca gaa ata aac acc act tec gtt tta gta gga cct 
Asn Asn Phe Ser Thr Glu lie Asn Thr Thr Ser Val Leu Val Gly Pro 
340 345 350 

ctt gtt tec aat ctg gaa ata acc cat acc tea aac etc acc tgt gta 
Leu Val Ser Asn Leu Glu He Thr His Thr Ser Asn Leu Thr Cys Val 
355 360 365 

aaa ttt age aat act aca tac aca acc aac tec caa tgc ate agg tgg 
Lys Phe Ser Asn Thr Thr Tyr Thr Thr Asn Ser Gin Cys He Arg Trp 
370 375 380 



960 



1001 



1056 



1104 



1152 
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gta act cct ccc aca caa ata gtc tgc eta ccc tea gga ata ttt :tt 

Val Thr Pro Pro Thr Gin lie Val Cys Leu Pro Ser Gly lie Phe ?he 

385 390 395 4CC 

gtc tgt ggt acc tea gec tat cgt tgt ttg aat ggc tct tea gaa tct 

Val Cys Gly Thr Ser Ala Tyr Arg Cys Leu Asn Gly Ser Ser Glu Ser 

405 410 415 



atg tgc ttc etc tea ttc tta gtg ccc cct atg acc ate tac act ga 
Met Cys Phe Leu Ser Phe Leu Val Pro Pro Met Thr He Tyr Thr Gl 
420 425 430 



etc ttt gga ccc tgt ate ttt aac etc ctt gtt aac ttt gtc tct tec 
Leu Phe Gly Pro Cys He Phe Asn Leu Leu Val Asn Phe Val Ser Ser 
595 600 605 



1243 



tac act gaa 1296 
u 



1344 



caa gat tta tac agt tat gtc ata tct aag ccc cgc aac aaa aga gta 
Gin Asp Leu Tyr Ser Tyr Val lie Ser Lys Pro Arg Asn Lys Arg Vaj. 
435 440 445 

ccc att ctt cct ttt gtt ata gga gca gga gtg eta ggt gca eta ggt 1j92 
Pro He Leu Pro Phe Val He Gly Ala Gly Val Leu Gly Ala ,eu Gly 
450 455 460 

act ggc att ggc ggt ate aca acc tct act cag ttc tac tac aaa eta 1440 
Thr Gly He Gly Gly He Thr Thr Ser Thr Gin Phe Tyr Tyr Lys Leu 
465 470 475 480 

tct caa gaa eta aat ggg gac atg gaa egg gtc gec gac tee ctg gtc 
Ser Gin Glu Leu Asn Gly Asp Met Glu Arg Val Ala Asp Ser Leu Val 
485 490 495 

acc ttg caa gat caa ctt aac tec eta gca gca gta gtc ctt caa aat 
Thr Leu Gin Asp Gin Leu Asn Ser Leu Ala Ala Val Val Leu Gin Asn 
500 505 510 

cga aga get tta gac ttg eta acc get gaa aga ggg gga acc tgt tta 1584 
Arg Arg Ala Leu Asp Leu Leu Thr Ala Glu Arg Gly Gly Thr Cys Leu 
515 520 525 



1488 



1536 



1632 



ttt tta ggg gaa gaa tgc tgt tat tat gtt aat caa tec gga ate gtc 
Phe Leu Gly Glu Glu Cys Cys Tyr Tyr Val Asn Gin Ser Gly He Val 
530 535 540 

act gag aaa gtt aaa gaa att cga gat cga ata caa cgt aga gca gag 
Thr Glu Lys Val Lys Glu He Arg Asp Arg He Gin Arg Arg Ala Glu 
545 550 555 560 

gag ctt cga aac act gga ccc tgg ggc etc etc age caa tgg atg ccc 
Glu Leu Arg Asn Thr Gly Pro Trp Gly Leu Leu Ser Gin Trp Met Pro 
565 570 575 

tgg att etc ccc ttc tta gga cct eta gca get ata ata ttg eta etc 1776 
Trp He Leu Pro Phe Leu Gly Pro Leu Ala Ala He He Leu Leu Leu 
580 585 590 



1680 



1728 



1824 
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aga ate gaa get gta aaa eta caa atg gag ccc aag acg cag tec aag 
Arg He Glu Ala Val Lys Leu Gin Met Glu Pro Lys Met Gin Ser Lys 
610 615 620 

act aag ate tac cgc aga ccc ctg gac egg cct get age cca cga tct 
Thr Lys lie Tyr Arg Arg Pro Leu Asp Arg Pro Ala Ser Pro Arg Ser 
625 630 635 640 

gat gtt aat gac ate aaa ggc acc cct cct gag gaa ate tea get gca 
Asp Val Asn Asp lie Lys Gly Thr Pro Pro Glu Glu lie Ser Ala Ala 
645 650 655 

caa cct eta eta cgc ccc aat tea gca gga age agt tag age ggt cgt 
Gin Pro Leu Leu Arg Pro Asn Ser Ala Gly Ser Ser Ser Gly Arg 

660 665 670 

egg cca acc tec cca aca gca ctt agg ttt tec tgt tga 
Arg Pro Thr Ser Pro Thr Ala Leu Arg Phe Ser Cys 

675 680 685 



1872 



1920 



1968 



2016 



2055 



<210> 23 
<211> 28 
<212> PRT 

<213> Homo sapiens 

<400> 23 , „ 

Pro Lys Thr Ala Asn Leu Val Ala Asp He Thr Ser Leu Ala ^ys Tyr 
15 10 15 

Gin Gin Val Leu Lys Thr Leu Gin Gly Thr Tyr Pro 
20 25 



<210> 24 
<211> 55 
<212> PRT 

<213> Homo sapiens 

<400> 24 t t i t 

Glu Glu Gly Lys Glu Leu Phe His Pro Cys Asp Met Val Leu Val Lys 
I 5 10 15 

Ser Leu Pro Ser Asn Ser Pro Ser Leu Asp Thr Ser Trp Glu Gly Pro 
20 25 30 

Tyr Pro Val He Leu Ser Thr Pro Thr Ala Val Lys Val Ala Gly Val 
35 40 45 

Glu Ser Trp He His His Thr 
50 55 



<210> 25 
<211> 38 
<212> PRT 

<213> Homo sapiens 
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<400> 25 

Val Lys Ser Trp He Leu Pro Lys Glu Pro Glu Asn Pro Gly Asp Asn 
15 10 15 

Ala Ser Tyr Ser Cys Glu Pro Leu Glu Asp Leu Arg Leu Leu Phe Lys 
20 25 30 

Gin Gin Pro Gly Gly Lys 
35 



<210> 26 
<211> 540 
<212> PRT 

<213> Homo sapiens 
<400> 26 

He Pro Met Ala Leu Pro Tyr His He Phe Leu Phe Thr Val Leu Leu 
15 10 15 

Pro Ser Phe Thr Leu Thr Ala Pro Pro Pro Cys Arg Cys Met Thr Ser 
20 25 30 

Ser Ser Pro Tyr Gin Glu Phe Leu Trp Arg Met Gin Arg Pro Gly Asn 
35 40 45 

He Asp Ala Pro Ser Tyr Arg Ser Leu Ser Lys Gly Thr Pro Thr Phe 
50 55 60 

Thr Ala His Thr His Met Pro Arg Asn Cys Tyr His Ser Ala Thr Leu 
65 70 75 80 

Cys Met His Ala Asn Thr His Tyr Trp Thr Gly Lys Met He Asn Pro 

85 90 95 

Ser Cys Pro Gly Gly Leu Gly Val Thr Val Cys Trp Thr Tyr Phe Thr 
100 105 HO 

Gin Thr Gly Met Ser Asp Gly Gly Gly Val Gin Asp Gin Ala Arg Glu 
115 120 125 

Lys His Val Lys Glu Val He Ser Gin Leu Thr Arg Val His Gly Thr 
130 135 140 

Ser Ser Pro Tyr Lys Gly Leu Asp Leu Ser Lys Leu His Glu Thr Leu 
145 150 155 160 

Arg Thr His Thr Arg Leu Val Ser Leu Phe Asn Thr Thr Leu Thr Gly 
165 170 175 

Leu His Glu Val Ser Ala Gin Asn Pro Thr Asn Cys Trp He Cys Leu 
180 185 190 

Pro Leu Asn Phe Arg Pro Tyr Val Ser He Pro Val Pro Glu Gin Trp 
195 200 205 

Asn Asn Phe Ser Thr Glu lie Asn Thr Thr Ser Val Leu Val Gly Pro 
210 215 220 
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Leu Val Ser Asn Leu Glu lie Thr His Thr Ser Asn Leu Thr Cys Vai 
225 230 235 240 

Lys Phe Ser Asn Thr Thr Tyr Thr Thr Asn Ser Gin Cys He Arg Trp 
245 250 255 

Val Thr Pro Pro Thr Gin He Val Cys Leu Pro Ser Gly He Phe Phe 
260 265 270 

Val Cys Gly Thr Ser Ala Tyr Arg Cys Leu Asn Gly Ser Ser Glu Ser 
275 280 285 

Met Cys Phe Leu Ser Phe Leu Val Pro Pro Met Thr He Tyr Thr Glu 
290 295 300 

Gin Asp Leu Tyr Ser Tyr Val He Ser Lys Pro Arg Asn Lys Arg Val 
305 310 315 320 

Pro He Leu Pro Phe Val He Gly Ala Gly Val Leu Gly Ala Leu Gly 
325 330 335 

Thr Gly He Gly Gly He Thr Thr Ser Thr Gin Phe Tyr Tyr Lys Leu 
340 345 350 

Ser Gin Glu Leu Asn Gly Asp Met Glu Arg Val Ala Asp Ser Leu Val 
355 360 365 

Thr Leu Gin Asp Gin Leu Asn Ser Leu Ala Ala Val Val Leu Gin Asn 
370 375 380 

Arg Arg Ala Leu Asp Leu Leu Thr Ala Glu Arg Gly Gly Thr Cys Leu 
385 390 395 400 

Phe Leu Gly Glu Glu Cys Cys Tyr Tyr Val Asn Gin Ser Gly He Val 
405 410. 415 

Thr Glu Lys Val Lys Glu He Arg Asp Arg He Gin Arg Arg Ala Glu 
420 425 430 

Glu Leu Arg Asn Thr Gly Pro Trp Gly Leu Leu Ser Gin Trp Met Pro 
435 440 445 

Trp He Leu Pro Phe Leu Gly Pro Leu Ala Ala He He Leu Leu Leu 
450 455 460 

Leu Phe Gly Pro Cys lie Phe Asn Leu Leu Val Asn Phe Val Ser Ser 
465 470 475 480 

Arg He Glu Ala Val Lys Leu Gin Met Glu Pro Lys Met Gin Ser Lys 
485 490 495 

Thr Lys He Tyr Arg Arg Pro Leu Asp Arg Pro Ala Ser Pro Arg Ser 
500 505 510 



Asp Val Asn Asp He Lys Gly Thr Pro Pro Glu Glu He Ser Ala Ala 
515 520 525 
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Gin Pro Leu Leu Arg Pro Asn Ser Ala Gly Ser Ser 
530 535 54C 



<210> 27 
<211> 15 
<212> PRT 

<213> Homo sapiens 
<400> 27 

Ser Gly Arg Arg Pro Thr Ser Pro Thr Ala Leu Arg Phe Ser Cys 
15 10 15 



<210> 28 
<211> 1080 
<212> ADN 

<213> Homo sapiens 

<220> 

<221> CDS 

<222> (1) . . (1080) 



<400> 28 

acc tct ttt gta gaa aag gca aat gga gtg aag tgc cat aag tac aaa 48 
Thr Ser Phe Val Glu Lys Ala Asn Gly Val Lys Cys His Lys Tyr Lys 
15 10 15 

ctt tct ttt cat taa gag aca act cac aat tat gta aaa agt gtg att 96 

Leu Ser Phe His Glu Thr Thr His Asn Tyr Val Lys Ser Val He 

20 25 30 

tat gcc eta cag gaa gec ttc aga gtc tac etc cct ate cca gca tec 144 

Tyr Ala Leu Gin Glu Ala Phe Arg Val Tyr Leu Pro He Pro Ala Ser 
35 40 45 

ccg act cct tec cca act aat aag gac ccc cct tea acc caa atg gtc 192 

Pro Thr Pro Ser Pro Thr Asn Lys Asp Pro Pro Ser Thr Gin Met Val 
50 55 60 

caa aag gag ata gac aaa agg gta aac agt gaa cca aag agt gcc aat 240 

Gin Lys Glu He Asp Lys Arg Val Asn Ser Glu Pro Lys Ser Ala Asn 
65 70 75 80 

att ccc caa tta tga ccc etc caa gca gtg gga gga aga gaa ttc ggc 288 

He Pro Gin Leu Pro Leu Gin Ala Val Gly Gly Arg Glu Phe Gly 

85 90 95 

cca gcc aga gtg cat gtg cct ttt tct etc cca gac tta aag caa ata 336 

Pro Ala Arg Val His Val Pro Phe Ser Leu Pro Asp Leu Lys Gin He 
100 105 110 

aaa aca gac tta ggt aaa ttc tea gat aac cct gat ggc tat att gat 384 

Lys Thr Asp Leu Gly Lys Phe Ser Asp Asn Pro Asp Gly Tyr He Asp 
115 120 125 
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gtt tta caa ggg tta gga caa ttc ttt gat ctg aca tgg aga gat ata 432 

Val Leu Gin Gly Leu Gly Gin Phe Phe Asp Leu Thr Ttd Arg Asp Ii* 
130 135 1 4 0 

atg tea ctg eta aat cag aca eta acc cca aat gag aga agt gec acc 4SJ 
Met Ser Leu Leu Asn Gin Thr Leu Thr Pro Asn Glu Arg Ser Ala Th- 
145 150 155 160 

ata act gca gec tga gag ttt ggc gat etc tgg tat etc agt cag gtc 52S 
lie Thr Ala Ala Glu Phe Gly Asp Leu Trp Tyr Leu Ser Gin Val 

165 170 175 

aat gat agg atg aca aca gag gaa aga gaa tga ttc ccc aca ggc cag 5^6 
Asn Asp Arg Met Thr Thr Glu Glu Arg Glu Phe Pro Thr Glv Gin 

180 185 190 

cag gca gtt ccc agt eta gac cct cat tgg gac aca gaa tea gaa cat 624 
Gin Ala Val Pro Ser Leu Asp Pro His Trp Asp Thr Glu Ser Glu His 
195 200 205 

gga gat tgg tgc tgc aga cat ttg eta act tgt gtg eta gaa gga eta 672 
Gly Asp Trp Cys Cys Arg His Leu Leu Thr Cys Val Leu Glu Gly Leu 
210 215 220 

agg aaa act agg aag aag tct atg aat tac tea atg atg tec acc ata 720 
Arg Lys Thr Arg Lys Lys Ser Met Asn Tyr Ser Met Met Ser Thr lie 
225 230 235 240 

aca cag gga agg gaa gaa aat cct act gee ttt ctg gag aga eta agg 768 
Thr Gin Gly Arg Glu Glu Asn Pro Thr Ala Phe Leu Glu Arg Leu Arg 
245 250 255 

gag gca ttg agg aag cgt gec tct ctg tea cct gac tct tct gaa ggc 816 
Glu Ala Leu Arg Lys Arg Ala Ser Leu Ser Pro Asp Ser Ser Glu Gly 
260 265 270 

caa eta ate tta aag cgt aag ttt ate act cag tea get gca gac att 864 
Gin Leu lie Leu Lys Arg Lys Phe lie Thr Gin Ser Ala Ala Asd He 
275 280 285 

aga aaa aaa ctt caa aag tct gee gta ggc ccg gag caa aac tta gaa 912 
Arg Lys Lys Leu Gin Lys Ser Ala Val Gly Pro Glu Gin Asn Leu Glu 
290 295 300 

acc eta ttg aac ttg gca acc teg gtt ttt tat aat aga gat cag gag 960 
Thr Leu Leu Asn Leu Ala Thr Ser Val Phe Tyr Asn Arg Asp Gin Glu 
305 310 315 320 

gag cag gcg gaa cag gac aaa egg gat taa aaa aaa ggc cac cgc ttt 1008 
Glu Gin Ala Glu Gin Asp Lys Arg Asp Lys Lys Gly His Arg Phe 
325 330 335 

agt cat gac cct cag gca agt gga ctt tgg agg etc tgg aaa agg gaa 1056 
Ser His Asp Pro Gin Ala Ser Gly Leu Trp Arg Leu Trp Lys Arg Glu 
340 345 350 
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aag 
Lys 



ctg ggc 
Leu Gly 
355 



aaa 
Lys 



ttg 
Leu 



aa: 
Asn 



gcc 
Ala 



taa 



360 



1080 



<210> 29 
<211> 20 
<212> PRT 

<213> Homo sapiens 
<400> 29 

Thr Ser Phe Val Glu Lys Ala Asn Gly Val Lys Cys His Lys Tyr Lys 
15 10 15 

Leu Ser Phe His 
20 



<210> 30 
<211> 63 
<212> PRT 

<213> Homo sapiens 
<400> 30 

Glu Thr Thr His Asn Tyr Val Lys Ser Val He Tyr Ala Leu Gin Glu 
15 10 15 

Ala Phe Arg Val Tyr Leu Pro He Pro Ala Ser Pro Thr Pro Ser Pro 
20 25 30 

Thr Asn Lys Asp Pro Pro Ser Thr Gin Met Val Gin Lys Glu He Asp 
35 40 45 

Lys Arg Val Asn Ser Glu Pro Lys Ser Ala Asn He Pro Gin Leu 

50 55 60 



<210> 31 
<211> 79 
<212> PRT 

<213> Homo sapiens 
<400> 31 

Pro Leu Gin Ala Val Gly Gly Arg 
1 5 

Val Pro Phe Ser Leu Pro Asp Leu 
20 

Lys Phe Ser Asp Asn Pro Asp Gly 

35 40 

Gly Gin Phe Phe Asp Leu Thr Trp 
50 55 

Gin Thr Leu Thr Pro Asn Glu Arg 
65 70 



Glu Phe Gly Pro Ala Arg Val His 
10 15 

Lys Gin He Lys Thr Asp Leu Gly 
25 30 

Tyr He Asp Val Leu Gin Gly Leu 

45 

Arg Asp He Met Ser Leu Leu Asn 
60 

Ser Ala Thr He Thr Ala Ala 
75 
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<210> 32 
<211> 21 
<212> PRT 

<213> Homo sapiens 
<400> 32 

Glu Phe Gly Asp Leu Trp Tyr Leu Ser Gin Val Asn Asp Arg Met Thr 
15 10 15 

Thr Glu Glu Arg Glu 
20 



<210> 33 

<211> 142 

<212> PRT 

<213> Homo sapiens 

<400> 33 

Phe Pro Thr Gly Gin Gin Ala Val Pro Ser Leu Asp Pro His Trp Asd 
1 5 10 15 

Thr Glu Ser Glu His Gly Asp Trp Cys Cys Arg His Leu Leu Thr Cys 
20 25 30 

Val Leu Glu Gly Leu Arg Lys Thr Arg Lys Lys Ser Met Asn Tyr Ser 
35 40 45 

Met Met Ser Thr lie Thr Gin Gly Arg Glu Glu Asn Pro Thr Ala Phe 
50 55 60 

Leu Glu Arg Leu Arg Glu Ala Leu Arg Lys Arg Ala Ser Leu Ser Pro 
65 70 75 80 

Asp Ser Ser Glu Gly Gin Leu He Leu Lys Arg Lys Phe He Thr Gin 

85 90 95 

Ser Ala Ala Asp He Arg Lys Lys Leu Gin Lys Ser Ala Val Gly Pro 
100 105 110 

Glu Gin Asn Leu Glu Thr Leu Leu Asn Leu Ala Thr Ser Val Phe Tyr 
115 120 125 

Asn Arg Asp Gin Glu Glu Gin Ala Glu Gin Asp Lys Arg Asp 
130 135 140 



<210> 34 
<211> 29 
<212> PRT 

<213> Homo sapiens 
<400> 34 

Lys Lys Gly His Axg Phe Ser His Asp Pro Gin Ala Ser Gly Leu Tro 
1 5 10 15 
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Arg Leu Trp Lys Arg Glu Lys Leu Gly Lys Leu Asn Ala 
20 25 



<210> 35 
<211> 685 
<212> PRT 

<213> Homo sapiens 
<400> 35 

Pro Lys Thr Ala Asn Leu Val Ala Asp He Thr Ser Leu Aia Lys Tyr 
15 10 15 

Gin Gin Val Leu Lys Thr Leu Gin Gly Thr Tyr Pro Xaa Glu Glu Gly 
20 25 30 

Lys Glu Leu Phe His Pro Cys Asp Met Val Leu Val Lys Ser Leu Pro 
35 40 45 

Ser Asn Ser Pro Ser Leu Asd Thr Ser Trp Glu Gly Pro Tyr Pro Val 
50 55 60 

He Leu Ser Thr Pro Thr Ala Val Lys Val Ala Gly Val Glu Ser Trp 
6 5 70 75 80 

He His His Thr Xaa Val Lys Ser Trp He Leu Pro Lys Glu Pro Glu 

85 90 95 

Asn Pro Gly Asp Asn Ala Ser Tyr Ser Cys Glu Pro Leu Glu Asp Leu 
100 105 110 

Arg Leu Leu Phe Lys Gin Gin Pro Gly Gly Lys Xaa Leu Lys Ser Xaa 
115 120 125 

He Pro Met Ala Leu Pro Tyr His He Phe Leu Phe Thr Val Leu Leu 
130 135 140 

Pro Ser Phe Thr Leu Thr Ala Pro Pro Pro Cys Arg Cys Met Thr Ser 
145 150 155 160 

Ser Ser Pro Tyr Gin Glu Phe Leu Trp Arg Met Gin Arg Pro Gly Asn 
165 170 175 

He Asp Ala Pro Ser Tyr Arg Ser Leu Ser Lys Gly Thr Pro Thr Phe 
180 185 190 

Thr Ala His Thr His Met Pro Arg Asn Cys Tyr His Ser Ala Thr Leu 
195 200 205 

Cys Met His Ala Asn Thr His Tyr Trp Thr Gly Lys Met He Asn Pro 
210 215 220 

Ser Cys Pro Gly Gly Leu Gly Val Thr Val Cys Trp Thr Tyr Phe Thr 
225 230 235 240 

Gin Thr Gly Met Ser Asp Gly Gly Gly Val Gin Asp Gin Ala Arg Glu 
245 250 255 
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Lys His Val Lys Glu Val lie Ser Gin Leu Thr Arg Vai His Glv Thr 
260 265 270 

Ser Ser Pro Tyr Lys Gly Leu Asp Leu Ser Lys Leu His Glu Thr Leu 
275 280 285 

Arg Thr His Thr Arg Leu Val Ser Leu Phe Asn Thr Thr Leu Thr Gly 
290 295 300 

Leu His Glu Val Ser Ala Gin Asn Pro Thr Asn Cys Trp lie Cys Leu 
305 310 315 320 

Pro Leu Asn Phe Arg Pro Tyr Val Ser lie Pro Val Pro Glu Gin Trp 
325 330 335 

Asn Asn Phe Ser Thr Glu He Asn Thr Thr Ser Val Leu Val Gly Pro 
340 345 350 

Leu Val Ser Asn Leu Glu He Thr His Thr Ser Asn Leu Thr Cys Val 
355 360 365 

Lys Phe Ser Asn Thr Thr Tyr Thr Thr Asn Ser Gin Cys He Ara Trp 
370 375 380 

Val Thr Pro Pro Thr Gin He Val Cys Leu Pro Ser Gly He Phe Phe 
385 390 395 400 

Val Cys Gly Thr Ser Ala Tyr Arg Cys Leu Asn Gly Ser Ser Glu Ser 
405 410 415 

Met Cys Phe Leu Ser Phe Leu Val Pro Pro Met Thr He Tyr Thr Glu 
420 425 430 

Gin Asp Leu Tyr Ser Tyr Val He Ser Lys Pro Arg Asn Lys Arg Val 
435 440 445 

Pro He Leu Pro Phe Val lie Gly Ala Gly Val Leu Gly Ala Leu Gly 
450 455 460 

Thr Gly He Gly Gly He Thr Thr Ser Thr Gin Phe Tyr Tyr Lys Leu 
465 470 475 480 

Ser Gin Glu Leu Asn Gly Asp Met Glu Arg Val Ala Asp Ser Leu Val 
485 490 495 

Thr Leu Gin Asp Gin Leu Asn Ser Leu Ala Ala Val Val Leu Gin Asn 
500 505 510 

Arg Arg Ala Leu Asp Leu Leu Thr Ala Glu Arg Gly Gly Thr Cys Leu 
515 520 525 

Phe Leu Gly Glu Glu Cys Cys Tyr Tyr Val Asn Gin Ser Gly He Val 
530 535 540 



Thr Glu Lys Val Lys Glu He Arg Asp Arg He Gin Arg Ara Ala Glu 
545 550 555 560 



WO 99/67395 



PCT/FR99/01513 



27 

Glu Leu Arg Asn Thr Gly Pro Trp Gly Leu Leu Ser Gin Trc Met Pro 
565 570 * 575 

Trp lie Leu Pro Phe Leu Gly Pro Leu Ala Ala lie lie Leu Leu Leu 
580 585 590 

Leu Phe Gly Pro Cys lie Phe Asn Leu Leu Val Asn Phe Val Ser Ser 
595 600 605 

Arg lie Glu Ala Val Lys Leu Gin Met Giu Pro Lys Met Gin Ser Lys 
610 615 620 

Thr Lys lie Tyr Arg Arg Pro Leu Asp Arg Pro Ala Ser Pro Arg Ser 
625 630 635 640 

Asp Val Asn Asp He Lys Gly Thr Pro Pro Glu Glu He Ser Ala Ala 
645 650 655 

Gin Pro Leu Leu Arg Pro Asn Ser Ala Gly Ser Ser Xaa Ser Gly Arg 
660 665 * 670 

Arg Pro Thr Ser Pro Thr Ala Leu Arg Phe Ser Cys Xaa 
675 680 685 



<210> 36 
<211> 360 
<212> PRT 

<213> Homo sapiens 
<400> 36 

Thr Ser Phe Val Glu Lys Ala Asn Gly Val Lys Cys His Lys Tyr Lys 
15 10 15 

Leu Ser Phe His Xaa Glu Thr Thr His Asn Tyr Val Lys Ser Val He 
20 25 30 

Tyr Ala Leu Gin Glu Ala Phe Arg Val Tyr Leu Pro He Pro Ala Ser 
35 40 45 

Pro Thr Pro Ser Pro Thr Asn Lys Asp Pro Pro Ser Thr Gin Met Val 
50 55 60 

Gin Lys Glu He Asp Lys Arg Val Asn Ser Glu Pro Lys Ser Ala Asn 
65 70 75 80 

He Pro Gin Leu Xaa Pro Leu Gin Ala Val Gly Gly Arg Glu Phe Gly 

85 90 95 

Pro Ala Arg Val His Val Pro Phe Ser Leu Pro Asp Leu Lys Gin lie 
100 105 110 

Lys Thr Asp Leu Gly Lys Phe Ser Asp Asn Pro Asp Gly Tyr He Asp 
115 120 125 

Val Leu Gin Gly Leu Gly Gin Phe Phe Asp Leu Thr TrD Arg Asp lie 
130 135 140 
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Met Ser Leu Leu Asn Gin Thr Leu Thr Pro Asn Glu Arg Ser Ala Thr 
145 150 155 160 

lie Thr Ala Ala Xaa Glu Phe Gly Asp Leu Trp Tyr Leu Ser Gin Val 
165 170 175 

Asn Asp Arg Met Thr Thr Glu Glu Arg Glu Xaa Phe Pro Thr Gly Gin 
180 185 190 

Gin Ala Val Pro Ser Leu Asp Pro His Trp Asp Thr Glu Ser Glu His 
195 200 205 

Gly Asp Trp Cys Cys Arg His Leu Leu Thr Cys Val Leu Glu Gly Leu 
210 215 220 

Arg Lys Thr Arg Lys Lys Ser Met Asn Tyr Ser Met Met Ser Thr lie 
225 230 235 240 

Thr Gin Gly Arg Glu Glu Asn Pro Thr Ala Phe Leu Glu Arg Leu Arg 
245 250 255 

Glu Ala Leu Arg Lys Arg Ala Ser Leu Ser Pro Asp Ser Ser Glu Gly 
260 265 270 

Gin Leu He Leu Lys Arg Lys Phe He Thr Gin Ser Ala Ala Asp He 
275 280 285 

Arg Lys Lys Leu Gin Lys Ser Ala Val Gly Pro Glu Gin Asn Leu Glu 
290 295 300 

Thr Leu Leu Asn Leu Ala Thr Ser Val Phe Tyr Asn Arg Asp Gin Glu 
305 310 315 320 

Glu Gin Ala Glu Gin Asp Lys Arg Asp Xaa Lys Lys Gly His Arg Phe 
325 330 335 

Ser His Asp Pro Gin Ala Ser Gly Leu Trp Arg Leu Trp Lys Arg Glu 
340 345 350 



Lys Leu Gly Lys Leu Asn Ala Xaa 
355 360 



<210> 37 
<211> 26 
<212> ADN 

<213> Homo sapiens 
<400> 37 

ggaccataga ggacactcca ggacta 



<210> 38 

<211> 25 

<212> ADN 

<213> Homo sapiens 
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<400> 38 

cctcagtcct gctgctggat catct 



25 



<210> 39 
<211> 27 
<212> ADN 

<213> Homo sapiens 
<400> 39 

cctccaagca gtgggaggaa gagaatt 27 



<210> 40 
<2L1> 28 
<212> ADN 

<213> Homo sapiens 



<210> 41 
<211> 30 
<212> ADN 

<213> Homo sapiens 
<400> 41 

ggaagaagtc tatgaattat tcaatgatgt 30 



<210> 42 
<211> 27 
<212> ADN 

<213> Homo. sapiens 
<400> 42 

gggacacaga atcagaacat ggagatt 

<210> 43 
<211> 27 
<212> ADN 

<213> Homo sapiens 



<400> 40 

ccttccctgt gttattgtgg acatcatt 



28 



<400> 43 

gccttcagaa gagtcaggtg acagaga 



27 



<210> 44 
<211> 25 
<212> ADN 



<213> Homo sapiens 



<400> 44 

gagcctccaa agtccacttg cctga 



25 
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<210> 45 
<211> 29 
<212> ADN 

<213> Homo sapiens 
<400> 45 

gatttcagta tctactagtc tgggtagat 



29 



<210> 46 
<211> 27 
<212> ADN 

<213> Homo sapiens 
<400> 46 

ctaggaaatc cagctagtcc tgtctca 



27 



<210> 47 
<211> 28 
<212> ADN 

<213> Homo sapiens 
<400> 47 

ccaagacagc caacttagtt gcagacat 



28 



<210> 48 
<211> 28 
<212> ADN 

<213> Homo sapiens 
<400> 48 

ggacgctgca ttctccatag aaactctt 



28 



<210> 49 
<211> 29 
<212> ADN 

<213> Homo sapiens 
<400> 49 

gcaatactac atacacaacc aactcccaa 



29 



<210> 50 
<2U> 26 
<212> ADN 

<213> Homo sapiens 



<400> 50 

gggggaggca tatccaacag ttagta 



26 
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<210> 51 
<211> 30 
<212> ADN 

<213> Homo sapiens 
<400> 51 

ccatctacac tgaacaagat ttatacactt 30 



<210> 52 
<211> 28 
<212> ADN 

<213> Homo sapiens 
<400> 52 

aatgccagta cctagtgcac ctagcact 28 



<210> 53 
<211> 31 
<212> ADN 

<213> Homo sapiens 
<400> 53 

cgaatacaac gtagagcaga ggagcttcga a 31 



<210> 54 
<211> 28 
<212> ADN 

<213> Homo sapiens 
<400> 54 

agcccaagat gcagtccaag actaagat 28 



<210> 55 
<211> 27 
<212> ADN 

<213> Homo sapiens 
<400> 55 

gcgtagtaga ggttgtgcag ctgagat 27 



<210> 56 
<211> 27 
<212> ADN 

<213> Homo sapiens 
<400> 56 

cccttaccaa gagtttctat ggagaat 27 



<210> 57 
<211> 27 
<212> ADN 

<213> Homo sapiens 
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<400> 57 

accgctctaa ctgcttcctg ctgaatt 



<210> 58 
<211> 420 
<212> PRT 

<213> Homo sapiens 
<400> 58 

Thr Ser Phe Val Glu Lys Ala Asn Gly Val Lys Cys His Lys Tyr Lys 
15 10 15 

Leu Ser Phe His Xaa Glu Thr Thr His Asn Tyr Val Lys Ser Val He 
20 25 30 



27 




Tyr Ala Leu Gin Glu Ala Phe Arg Val Tyr Leu Pro Ile\Leu/Pro Ala 
35 40 45 

Ser Pro Thr Pro Ser Pro Thr Asn Lys Asp Pro Pro Ser Thr Gin Met 
50 55 60 

Val Gin Lys Glu He Asp Lys Arg Val Asn Ser Glu Pro Lys Ser Ala 
65 70 75 80 

Asn lie Pro Gin Leu Xaa Pro Leu Gin Ala Val Gly Gly Arg Glu Phe 

85 90 95 

Gly Pro Ala Arg Val His Val Pro Phe Ser Leu Pro Asp Leu Lys Gin 
100 105 HO 

He Lys Thr Asp Leu Gly Lys Phe Ser Asp Asn Pro Asp Gly Tyr He 
115 120 125 

Aso Val Leu Gin Gly Leu Gly Gin Phe Phe Asp Leu Thr Trp Arg Asp 
* 130 135 140 

He Met Ser Leu Leu Asn Gin Thr Leu Thr Pro Asn Glu Arg Ser Ala 
145 150 155 160 

Thr He Thr Ala Ala Xaa Glu Phe Gly Asp Leu Trp Tyr Leu Ser Gin 
165 170 175 

Val Asn Asp Arg Met Thr Thr Glu Glu Arg Glu Xaa Phe Pro Thr Gly 
180 185 190 

Gin Gin Ala Val Pro Ser Leu Asp Pro His Trp Asp Thr Glu Ser Glu 
195 200 205 

His Gly Asp Trp Cys Cys Arg His Leu Leu Thr Cys Val Leu Glu Gly 
210 215 220 

Leu Arg Lys Thr Arg Lys Lys Ser Met Asn Tyr Ser Met Met Ser Thr 
225 230 235 240 

He Thr Gin Gly Arg Glu Glu Asn Pro Thr Ala Phe Leu Glu Arg Leu 
245 250 255 
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Arg Glu Ala Leu Arg Lys Arg Ala Ser Leu Ser Pro Asp Ser Ser Glu 
260 265 270 

Gly Gin Leu He Leu Lys Arg Lys Phe lie Thr Gin Ser Ala Ala Asp 
275 280 285 

lie Arg Lys Lys Leu Gin Lys Ser Ala Val Gly Pro Glu Gin Asn Leu 
290 295 300 

Glu Thr Leu Leu Asn Leu Ala Thr Ser Val Phe Tyr Asn Arg Asp Gin 
305 310 315 320 

Glu Glu Gin Ala Glu Gin Asd Lys Arg Asp Xaa Lys Lys Gly His Arg 
325 330 335 

Phe Ser His Asp Pro Gin Ala Ser Gly Leu Trp Arg Leu Trp Lys Arg 
340 345 350 

Glu Lys Leu Gly Lys Leu Asn Ala Xaa Xaa Gly Leu Leu Pro Val Arg 
355 360 365 

Ser Thr Arg Thr Leu Xaa Lys Arg Leu Ser Lys Xaa Lys Xaa Ala Ala 
370 375 380 

Pro Ser Ser Met Pro Leu lie Ser Arg Glu Ser Leu Glu Gly Pro Leu 
365 390 395 400 

Pro Gin Gly Thr Lys Val Leu Xaa Val Arg Ser His Xaa Pro Asp Ser 
405 410 415 

Ser Ser Arg Thr 
420 



<210> 59 
<211> 32 
<212> ADN 

<213> Homo sapiens 
<400> 59 

taaactacaa atggttcttc aaatggagcc ca 



<210> 60 
<211> 32 
<212> ADN 

<213> Homo sapiens 
<400> 60 

gatgcagtcc aagatgcagt ccatgactaa ga 



<210> 61 
<211> 1740 
<212> ADN 

<213> Homo sapiens 



32 
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<400> 61 

aggttggctg acaaccgctc ttaactgctc 
gcagttgaga tttccttggg aggggtgcct 
gcaggccagt ccaggggtcc gcggtagacc 
tgaagaacca tttgtagttt tacagcttcg 
ttaaagatac aaggattgaa atgtacggcc 
tgcaagtggg gtttccttta gaaaaactcc 
gccacattct ccatagaagc tctcggcaag 
ggggtgcagt gagagtgaaa gggggtaaga 
gggccaagag gatctacgat; tctagttact 
gcagatcctc tagaggttca caggaatagc 
ttggcagtat ccagggtttg gctcgagtgt 
aactgcggtt agggtagata aaatgactgg 
tggggaatta aaggggaagg gacttgacta 
ttccctcctc tcagggacag gttccctgta 
aggaggtgat gtctgcaact aagttggccg 
ggaagggctg tccatacagc atctcatatg 
ggattcttag taaggctata ggcaacagag 
gcttttttag atgtcgtttg agtgtttcat 
gcctccaggc acagtgtaag tgatattgta 
ctgcagcctt gaaattgggg ccattgtcac 
gaattatttc atgaattagt acttttatta 
aggcctccac ccaaccagtg aaagtaccca 
gggcatgtgg gtaaaatcta gttgctagtc 
tcctgaagga gcttggcaat aaggcagggg 
gactatctgc ttgacagttt tgaaaaggcc 
atgggtgctg tcaatgccta agtgaaaggt 
gttagctgca ggcaaaagta ttttttcttt 
atgtcctcgt gagtttcccc attccatttc 
gaggggatta ccccatacta ggggtccttc 



<210> 62 
<211> 7140 
<212> ADN 

<213> Homo sapiens 
<400> 62 

ttggtcttaa gaacacaaat gatatggctc 
tctcacgctg atttagataa aacgactgtc 
ccctgtgacc tgcacgtata catccagatg 
gtgaaaatgg cctgttcctg ccttaactga 
cccatcttaa ctgagcgatt aaccttgtga 
actgagcacc ttgtgacccc cgcccctgcc 
ttccactacc cacccaaatc ctataaaatg 
tttttcggac tcagcccgcc tgcacccagg 
gcctgtttgg tggactctct tcacacggac 
taggaggact ccttcaggag accagtcccc 
acctacaacc ttgggtcctc agaccaacca 
aggtaagcag tcttttcact ctcttctcca 
ctcactaccc ttcaatctcc ctgtccttcc 
acaaaggaga cacattttat ccatggaccc 
agacagtctt cccttggtgt ttaatcactg 
ctccattggt gtctgatcac ggtggggaca 
ggtggtacgt caactgcaaa agcaggggac 
tctgtgtctc tacctttctc tttaaactta 
ccattccccc ttcttctccc ttagcctgtg 



34 



catgctgaat tggggcatag taggggtcgt 60 

tcaatgtcat caacattgga gcatgggcta 120 

ttagtcatgg actgcatctg gggctccatt 180 

attctggaag agacaaacgt aacaaggagg 240 

tgaagtgcag gggcatatga gtgtgggcgg 300 

gatacaatag ggcatcaata tttctaggaa 360 

gggagctact ggtagtacag cagcatacag 420 

gaacagtaaa aagaaaaata tgacaaggga 480 

ttcctcacgg ttgtcgcctg aagagcaggc 540 

tagcattgtc tgctggattc tcgggttcct 600 

gacttatcca agactccact ccagccactt 660 

gtagggtcct tcccaggatg tgtgtaggga 720 

ataccatgtc accagggtgg aataattcct 780 

atgttttaag aactcgttga tatttggcta 840 

tctctcagtc aagcacaagg tcattggtta 900 

gactaagtcc tgctttttgg ggacagtttc 960 

caggccatgc aaggtgggtt tcttgggtta 1020 

tcattttctc aacttttcct gaggatcgtg 1080 

tacctaacgc ctgggatacr ccctgcgtta 1140 

tctgtaaacc tcagggaagt ccgaatctgg 1200 

cctcttgggc cttttctgtc ctacaaggga 1260 

gattagtaga tactgaaatc tctgagattt 1320 

ttctcctggg taatggcctg ttctttgttc 1380 

attatttctt tggcacactt cacaggccct 1440 

tggtccagta aataatgatt tggccatctg 1500 

ctggtgaagg gttttaagta atttccattg 1560 

ggtggctggc catcctgagg agaggaaact 1620 

ttctgctgag tactggagct tggtttccca 1680 

tgtaagcatt tctaatggag agtcctgcct 1740 



caatgactgg aggaacacca gggtccttgg 60 
aggcctctga gcccaagcta agccatcctc 120 
gcctgaagta accaaagaat cacaaaagca 180 
tgacattcca ccattgtgat ttgttcctgc 240 
aattccttct cctggctcaa aacctccccc 300 
cctaagagaa aacccccttt gattataatt 360 
gccccacccc tatctccctt cgctgactcc 420 
tgaaataaac agccttgttg ctcacacaaa 4 80 
gctcatgaca tttggtgcca aaacctggga 540 
tgtccttgcc ctcactctgt gaggacatcc 600 
gcccaaggaa cagctcacca atttcaaatc 660 
gcctctcttg ctacccttca aactccctct 720 
aattccagtt ctttttcatc tctagtagag 780 
aaaactccag caccagtcac ggacttggga 840 
cggggacgcc tgcctgatta ttcacccaca 900 
cctgccttgg tcactcaccc acattccctt 960 
gcctgctttg gctgctcacc cacccccttc 1020 
cctccttcac tatgggcaaa cttctgccct 1080 
ttcttaaaaa cctaaaacct cttcaactca 1140 
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cacctgacct aaaacctaaa tgccttattc 
aacttgataa tagctttaaa tggccagaat 
atctagataa tttttgtgga aaaatggaaa 
ccttttacac attggtccct ccctagtctc 
cttctttctc tcctgtctgt tccttcagtc 
tcctttgcta cagacccatc tgaactctcc 
gagccaggtc ccaattcttc ctcagcctct 
tcctctcctc acactcagtc cggcttacag 
gcccaacaat ttcctcttaa agaggtggct 
cctttttctt tatctgacct ctcccaaatc 
ataaaaaccc agccagttca tggcccatct 
agaccctgaa gggtcagaag gccgtcttat 
tcccaacatt aaataaagct ccaaaaatta 
ttaattaacc tcacttcaag gtgtacaaga 
tttgagttgc aattccttgc ctcaactctg 
aagaacttca aaacacctga actgcagcag 
ggatcttgct tcaagtgccg gaaatctgac 
attcctccta agccacgtcc catttgtgca 
cacccggcag ccaatcccag agcccctgga 
ttcccagatc ttctcggctt agcagctgaa 
ccctggacca tcacggatac tgagcttcag 
ccctgtttaa tcgatacagg ggctacccac 
tccctttccc ccataactgt tgtgggtatt 
cccccactct ggtgccaact tggacaacat 
acctgcccag ttcccttatt aggccgagac 
atztcctgggc tacagccaca tctccttgcc 
tatcttcctc tcatatcccc ccaccttaac 
ctggcaaccg atcacacgcc cattactatc 
caatgccagt atcccatacc acaacaggct 
ctgctacagc acgggcttct aaaacctata 
gtctaaaaac cagataagtc ttacaggtta 
gttttgccta tccaccctgt agcacccaac 
cccacaactc actattccgt tcttgatctt 
ccctcatccc agcctctctt tgcttttacc 
cagcttacct gggctgtact gccgcaaggc 
gctctttctc atgatttact ttctttccac 
gatgaccttc tactttgtag cccctccttt 
cttcaacatt tgttctccaa aggatatcgg 
ccatctgtta catacctcgg cataattctt 
tgcgtctcca actgatctct caaatcccaa 
tcctaggcat ggttggatac ttttgccttt 
cattatataa actcacaaaa ggaaacctag 
actcctcttt ccattccttg aagacagctt 
tctcatccca acccttttca ttacacacag 
ttacacaagg accgggacca tgccctgtag 
ttttaggctc gccatcatgt ctccatgcgg 
ccctcaaaat cacaaactat gctcaactca 
tattttcttt ctcacacctg acgcatatac 
cactctttgt tgagtctccc acaattacca 
cccacattat tctggatacc acacctgacc 
cattcacccc atttccccat atttccttct 
ttactgacgg cagttccacc aggcctgatc 
tagaatcttc cacatccatc attgaggcta 
aagccgaact gattgcctta actcgggcct 
tttatactga ctctaaatat gccttccata 
aaagaggttt cctcactacg caagggtcct 
ttctcaaggc tgctttactt ccaaaggaag 
aggcgtcaga tcccattact ctaggaaatg 



35 

tcttctgcaa cactgcgtgg ctgcagtaca 1200 
atggcacttt caatt tctcc atcctacaag 1260 
aatggtctga gatgcctgac gtccaggca" 1320 
tgcccccaat gcgactcatc ccaaatcttc 1380 
tccaccccaa gctctgagtc ctttgaatcc 1440 
cctccccccc aggctgctcc tcaccaggcc 1500 
gctcccccac cctataatcc ttttatcacc 1560 
tttcgttctg tgactagccc tcccccatct 1620 
ggagctaaag gcatagtcaa ggttaatgct 1630 
agttagcgtt tacgctcttt ctcatcaaat 1740 
ggcaacaacc cttacaggct ttacagccct 1800 
tctcaatatg cattttatta cccaatccgc 1860 
aattctggcc ctcaaacccc acaacaggac 1920 
atagagtaga ggcagccaag tagcaacgta 1980 
agagaaaccc cagccacatc tccagcaaac 2040 
ccaggcgttc ctccaggacc acctccccca 2100 
cattgggcca aggaatgcct gcagcccagg 2160 
ggaccccact ggaaatcgga ctgtccaact 2220 
actctggccc aaggctctct gactgactcc 2280 
gactgacact gcccgatcac ttcagaagtc 2340 
gtaactctca cagtggaggc taagtccatc 2400 
tccacatcac cttcttttca agggcctgtt 2460 
gacggccaag cttcaaaacc ccttaaaact 2520 
tcttttatgc actctttttc agttatcctc 2580 
attttaacca aattatctgc ttccccgact 2640 
gcccttcttc ccaacccaaa gcctccttca 2700 
ccacaagtat gggacacctc tactccctcc 2760 
ccattaaaac ctaatcaccc ttaccctgct 2820 
ttaaagggat tgaagcctgt tatcacttgc 2880 
aactctccat acaattcccc cattttacct 2940 
gttcagaatc tgcaccttat caaccaaatt 3000 
tcgtacactc ttttgtcctc aatgccttcc 3060 
aaagatgctt ttttcactat tcccctgcac 3120 
tggactgacc ctgacaccca tcagtcccag 3180 
ttcagggaca gccctcatta cttcagccaa 3240 
ctctctgctt ctcaccttat tcaatatatt 3300 
aaatcttctc aacaagacac cctcctgctc 3360 
gtatccccct ccaaagctca aatttcttct 3420 
catgaaaaca catgtgctct ccctgccaat 3480 
cctcttctac aaaacaacaa ctcctttccc 3540 
ggatacctgg ttttgccatc ctaacaaaat 3600 
ctgaccccat agattctaaa tcctttcccc 3660 
tagagactgc tcccacacta gctctccctg 3720 
ccgaagtgca gggctgtgca gtcggaattc 3780 
cctttttgtc caaacaactt gaccttactg 3840 
tagcttccgc tgccctaata cttttagagg 3900 
ctctctacag ctctcacaac ttccaaaatc 3960 
tttctgctcc ccggctcctt cagctgtatt 4020 
ttcttcctgg cccagacttc aatctggcct 4080 
ctgatgattg tatgtctctg atctacctga 4140 
tttctgttcc tcatgttgat cacatttggt 4200 
gccactcacc agcaaaggca ggctatgcta 4260 
ctgctctgcc cccctccact acctctcagc 4320 
tcactcttgc aaagggacta cacgtcaata 4380 
tcttgcacca ccatgctgtt atatgggctg 4440 
ccatcattaa tgcctcttta ataaaaactc 4500 
ctggagtcac acactgcaag ggccaccaaa 4 560 
cttatgctga taaggtagct aaagaagcac 4620 
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ctagcgttcc aacttctgtc cctcatggcc 
cctactcccc cattgaaact tccgcctatc 
tagaccaagg aaaatatctc cttccagcct 
ataacctctt ccatgtaggt cacaagccac 
tccatcgtgg aaacatatcc tcaaggaaat 
tacccctcag ggattgttca ggccccctcc 
ccctgcccag gactggcaaa ttgactttac 
cctcttggtc tgggtagaca ctgtcactgg 
gaaggccact gcagtcattt cttcccttct 
cacctctata cagtccaata acggagcagc 
tcaggctctt ggtattcagt ggaaccttcg 
ggtagaatgg actaatggtc ttttaaaaac 
aaaggaggat agagcccaaa aactcgcaac 
gcactctcta attggatgtc ttaggtcctc 
ctccttctct tattcggacc ttgtgtcttc 
atccaggcca tcaccaatcg ttctatacaa 
cgccccttac cacaaaatct tccttcagct 
cccataatcc ctctcgaagc agccctgaga 
ccaaaatttt tgctgcccca acacttcaac 
aagaagacag caatgtcagg cctctgagcc 
tatacatcca gatggcctga agtaactgaa 
cctgccttaa ccgatgacat tccaccactg 
aattaacctt gggaaattcc ttctcctggc 
cccctgcccc tccactaccc acccaaatcc 
ctgactcctt ttttggactc agcccgcctg 
cacacaaagc ctgtttggtg gactctcttc 
cacatggagt ggttttaagg agcagagagt 
cctgtacaga cacagaggga gggggctcca 
gaaaagtggt tgattatact gggaggctgg 
aggggattgg gttgaccagg tgtatcattc 
cctcagccct ttaatatgca aatgtgggtt 
ctggaggggg ccatgacact tggtacatgt 
gtggccatgt tgggtggacc tagtttttaa 
gcctggctct ttaagctgtc ttttctgtta 
tgcttcttat tacaagaaaa tttccaaaaa 
tttcttaata acttatgtat taccataatt 
ccactgcaat taacatgctg gctttactgc 
tcatattgca actgcctgac ctctgccacc 
gcccatttcg attgtaacat ctgccactta 
aattcattca acatccattc caacaccacc 
gaattactga gtcacatgat cttcactgca 
acagtgaaca tagacagaag tccctggggc 



<210> 63 
<211> 44100 
<212> ADN 

<213> Homo sapiens 
<400> 63 

tgcctttatt tccgtaggct ggtcatatgg 
agcgaatgaa accaaaatca ctttaccttc 
ttggcccgtg tgtcgcatac cgccctctgg 
ccgccgctcg acgccatctt gcctactttg 
ctgagctccc ttttatccaa taagagagcg 
gagaatcgac agcgtcggcc atcgtttcct 
cccccgagcg gctcggcgga gaggcgcggt 
tacaggctta cggcaggatg cgcagcgggg 
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agtttttctc cttcccatca gtcattccca 4680 
aatctcttct cacacaaggc aaatggttct 4740 
cacaggccca ttctat tctg tcatcatctc 4800 
tagtccacct cttagaacct ctcatttccc 4860 
cacttctcag tgttccatct gctattctac 4920 
cctccctaca catcaagctc ggggatttgc 4980 
tcacatgccc tgagtcagga aactaaaata 5040 
atgggtagag gcctttccca cagggtctga 5100 
gtcagacata attccttggg ttggccttcc 5160 
ctttattagt caaatcacct gagcagtttt 5220 
taccccttac tgtcctcaat cttcaggaaa 5280 
acaccccacc aaactcagcc tccaacttaa 5340 
caagctagta attatgctga acccccttgg 5400 
ccaaatctta gtcctttaat atctgttttt 5460 
cgtttagttt ttcaattcat acaaaaccgc 5520 
taaatgctcc ttctaacaac cccacaatat 5580 
taatctctcc cactctaggt tcccatgccg 5640 
aacatagccc attatctctc cataccaccc 5700 
actattttac attatttttc ttattaatat 5760 
caagccatca tatcccctgt gacctgcaca 5820 
gaatcacaaa agaagtgaaa atggcctgtt 5880 
tgatttgttc ctgccccacc ttaactgagc 5940 
tcaaaacctc ccccactgag caccttgtga 6000 
tataaaatgg ccccacccca tctcccttag 6060 
cacccaggtg aaataaacag ccttgttgct 6120 
acagggacgg gggtgacaac aacacggaca 6180 
ttaatacgca aaaaagaagg aagaggctcc 624 0 
agccgagaga aggaaacccc atgtgcagtg 6300 
aggaggcggt gtctgatttg cacagggccc 6360 
atgtaccccg caaaaaacct ggccctccca 6420 
gccatgatgt tctgaaaaca catgaattat 6480 
gctgacaaga agagggtggg aatcgccatg 6540 
tagcctgcat ttgcatatca aagtttgctg 6600 
gaaaaggaat ggtttggaat gggtgagggt 6660 
cctttactct ttctagctgc caaaaaacta 6720 
aggcagcacc aaagatccct gcaggtcaga 6780 
tgattatggt agctgcatcc acctagcctc 6840 
ccacgagcca cttatcccca cttataatca 6900 
ttcccgacgt tgtggtatat cctatagatg 6960 
tctcttgcct tcctatactc tctggagagt 7020 
gtcatttgtg gctatgtgac atagttctgg 7080 
gggcttcctt tctgggatga gggcaaaacg 714 0 



cgctagcact cacataaagc taccgaggag 60 
acagcacgag gccgtcgtcc ctctcgatat 120 
acgtggtgat caaataaact ccctagctcc 180 
atcctcgcag ggaggacaac atccgcccta 240 
ggatgagtta aggagtgcca ggattggctg 300 
gcgtgcgaag atttgatgaa cgaggtgccg 360 
gggtgacaga agctttcttg tcccacccac 420 
agagggggcg gggccgcagg gggcggggcc 4 80 
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gatcgatctc ctccggctcc gacgtcctcg 
tagggtgggc gaacccagag cgacgctccg 
gtgctggggg aggcggggcg gcagtgactc 
tccacctgcc gcggcgtctc gtggcccagc 
gagccacctg atcttcagcc tggggtcgga 
gacaccggct gccacccggg cgccgccgaa 
gggcccttct gggtagtctc tggatcccac 
cccaggtctt ttcacttggt gaaactgaac 
tttataaata ttccttattc caggctggaa 
ttttaaaagg tgttttcctt gccagccatt 
ccgcgagagc gggacgcaga gttgttggcg 
ccgcgtccca tgagcgggaa aggttaatac 
ggaacacagc tgtagtgtgt taggaacaca 
gatcagtcgc ccttctggac gttgtggtta 
gatacagcgt ccatattttc ataattaaaa 
gtacttatgg gggcaaaagg acggcgtatt 
acccaccagt ggctaatcta tgcaatgaat 
tttccacttg agttacttcc ccatacctag 
gagttcagca gaatcctcct atcatcgtcg 
ttttggtttt tgatgggctt tatggccaga 
gtagaagttg gttcagtgct ctgtcagctt 
tgcacttaat agtaggaatg ctttcttaca 
gttaccttac attcatcact gtttaagaat 
gagccttcgg gaagtactta taagaattaa 
ctttagccct ggaacaaatt gctgtttctg 
ttactttcta attatcaatg taataagttt 
tttattcctc gatgaattat ataaatttat 
gcatggaaaa ttattaacaa gaaaataagt 
aatgttgaca gtttggatca aatcttccag 
atgaggtcct gtatacacac gtacagtttt 
tgagtgtttt attttgttaa aaggtcatca 
aatttgccat aatttattta attgtttact 
ttaggcatta gaagtgataa actatatttt 
ttagaaaaca tcattttatt tctggttgtc 
aggccataga taattatgaa agcagaaaga 
ctttatttgg ggtgaagcat tgagtgcata 
ttggaacaat ggttttctgg cctatgtcag 
gttctgatca accctcagac ctattaaatc 
gcatctctaa ttttaaaaaa tttattcagg 
actgtcctag aatcatagaa ttttaatgac 
tgtactttta catgtaagga aactggcatt 
tttgccctct tgtctatagc tcactctgca 
ctataaccaa tctccttccc acttctgttc 
ttttcttcct tccatacaaa ttccatgtct 
tagctttcca attctctgtt gcccacattt 
atgtgacaca tcacatttga tatactctgt 
tactcaagtc attatttcag gactgactac 
accttggcac tgttgacatt ttgagctgga 
attttaagat gtttaacagc acccttggcc 
cctatctgtg acaaccaaaa aggtcttcag 
tcacctctgg ttgagaacca ccgcttcaac 
tgtgattgca gcagggggag aggattcata 
ccattcggat atggccacac aattttcatt 
tttggacctg attattccta aggcattctg 
aatactgata cctcagtttg ggtcaaagaa 
cctggaaaag acgctccttt ctagctgtct 
tctgtggttc aagtgaagta ttttgacata 
tttgctcaat ataactgagc acatattgtg 
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gcctgccggg tcccgggtcc cttgcggcgc 540 
ggacgatgtg gggcagcgat cgcctggcgg 600 
-ggccttcac caacgctcgc gacccctccc 660 
tgcatctgct gcaggnaacc tgcccgcccc 72C 
cgaggccgaa gcctctcagg gacgcggcgg 780 
gcgcgcagag atcagggtcc ctcgacggca 840 
aagtccagtg cagccctggg ctcgtcttat 900 
ctagaaacgt cctaarattc taccactgtt 960 
aagctcctga gaagtggttt gttitttatca 1020 
tccagttaac ctgcgctgct gccgtccggc 1090 
gagcccctgt cggttcccgg ggactaagca 1140 
aatgatggtt ctgccctgcg tcgctgacgc 1200 
taacgtagtt aagatcactt gaagctctgc 1260 
ggatgtttca cagttctaac cactggtgga 1320 
atagaggcac atggtctcac gagtttgagc 1380 
tgaaatcctc ataaatcctg gatgcatggt 1440 
agagtttgca ataatttcaa gcatcccttc 1500 
gggaagatat ttttggtcca ctgaaaacat 1560 
ttattattct ttaccactaa gtagacaatc 1620 
gacaaatcag tcactgtcac caagttccag 1680 
cgatgggatt tttcaacarg ttttcaaacc 1740 
gtaactctaa tttgatcc-a agatgtagtt 1800 
ttagtggtct tgatctttgt tttaaatttt 1860 
ttcatgcata tctttttgaa atgtaaatgt 1920 
ttcagcccat attagcagaa taggtcaact 1980 
attactttat agattccata aatctataca 2040 
agaatttatg ttttatagaa aatttggaaa 2100 
tacccataat cccagaactt agaggtgact 2160 
ttttgtttct aatctttatt tttaacataa 2220 
gtgtcctggt gtttttattt aatgttatta 2280 
ttttaagttg ttaattagta ttctagcaca 2340 
atgattgacc atttagattg tacttaattt 2400 
aatcagacgt tgaaaataac acatctttgt 24 60 
taggatagat tcccagaatt cttgggttag 2520 
ttcacaagtt gggagttaat acttgaatta 2580 
atacagatca tgcagtaatg ggaagaaggg 264 0 
acttaccttg aagcttttaa gaatacagat 2700 
agacctaaaa tcttagggaa taggctttag 2760 
ctacttggat gcacaaaaga gttgagacct 2820 
gatagagacc ttaagcatct aggtcgtttc 2880 
cctaggccag taccattgcc atgcagctaa 2940 
tcacccaacc taccgttctc actgtttctt 3000 
tcttactcat gccattcttc cctcagtcat 3060 
ttaaaaagga ataatcctac ctcctccaca 3120 
gtctcccttt caatacttct ctgttgtgtt 3180 
actgtgtttc aagtattgta ttctcttgtt 3240 
ccagtagatg ctttaagtca ggatttctca 3300 
taattttttg ttttgggggc tctcctgtac 3360 
tctatccagt agacgcctgt actgcctccc 3420 
acattgtcag atgtctactg aaggacaaaa 3480 
taagttatct tctctgtact cagaacttga 3540 
tacacagtga atgcaaacga acctaaatca 3600 
tcccttgtgt tagcaagaga taccctaggc 3660 
atgtatggtt ttacctgcag atttcctggt 3720 
ggtcaattaa ttgattgatt tgatttgact 3780 
ctttcttctc tttacctgaa tagccagggc 3840 
aaaattaact tagaacattg gtctgcagag 3900 
gctttatgga gctggttact actttttgac 3960 
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caaataaata attagaagta ttttccctcc 
gagctggtag agttuccttt tttgatatct 
gtttcctcat atgaagtaga atttatctgg 
atagaaagca tctggggctt gatcaccttc 
gatatggtaa cttaagactt ttgattccaa 
tttgtcagcc agaacagttg gactgttctg 
gtgatacatg atgatggctt tcttaaatat 
acgttatatt gtcccagaag tggctccaac 
cataagctgg ctatggtggc tcacgcctgt 
cagatcacct gaggtcagga gttcgagacc 
tactaaaaat acaaaaatta gccgggcatt 
gaggctgagg caggagaatt gcttgaatct 
gtgccactgc cctccagcct gggtgacaga 
aaaagcaaga aacataaaga ctgggcatgt 
gagactgagg tgggaagatc acttgagccc 
ttgccactgt actcgagcct gggcaacaca 
gcatgtaaat gaatgaattt gatatttaat 
atgtagatct tgccatgttg cccaggctgg 
tgtctcagtc tcccaaagta taaagattac 
ttttaactta atgaatttat tttgatataa 
taataagtct ttttgtgtgt gtgacgggtt 
ggcactatca tggctcactg tagcctcaac 
gcttcctgag tagatgggac cacaggcgta 
tattattgat acatattaat aaaattattt 
atggtggctc atgcctgtaa tcccgacagt 
gaccaggagc ttaagaccag cctaagcaac 
aaatggctag gtgtggtggt gtatgcctat 
aggattgcta gagcccagga gtttcaagtt 
cagcctgggc aacagagcaa aatcctgtct 
gatgcaatat aagtagtgga aaaggatatt 
aaaaacttgc acatagagaa aaggattaac 
tcttgtttgt ggagagaata tcagtagttc 
cgaggtctct ataatgagtt tgtaattgtt 
gccacaaact tacatgtttt aatgtaattg 
gcttttttaa aacctatatt cccatagtta 
ataatataac gtttctggaa gggtacagaa 
gacatggctt cacattttac ccttttgtac 
ttcttccaat aaataagtaa ataaatatgg 
aattctaaaa ttatattgct acatttttaa 
tatgttaaaa tagtaaattt atatcttatt 
acagtctcaa gtgttcacta tcatagaaaa 
ttttttcttc gaatcgttaa ttgggaataa 
ctatttaagt ttattgactg actgctgcca 
ataatgctgc cataagaata taagggtatt 
ttggaaatga ttatagattt ttaaatgcta 
tagaactctt tttggacatg tgaattgtaa 
aatgtatacg aaaacctttt ttcctctcat 
gtggtctgga gtcaccagcc tgcattcttg 
gggggacagg taagcacatg tgatggcaat 
atagaaataa aattaaaagt ttagattttt 
gtatgctatt atgtaactag tctaggatat 
ttatcttgta gtttaccata ctccctactt 
cacatcccct aattttggtt tcatgaaatt 
tactattatt aaactttatt tctgacatat 
aaaataaaaa attcagctgg gtgcggtggc 
ccaaggtggg cggataattt gaggtcagga 
accccccctc tctactaaaa attcaaaaat 
cccagctact caggaggctg aggcaggaga 
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tcaataaggt tcatttttcc -tttttcagt 4 020 
cagggcatct ttcatatttc catctcttas 4090 
attatgtatt gctgactctg acgaaaacc: 4 1-^3 
attcttgtaa tagcccacac ggttacagc- 4200 
atctaggcaa aatacactca gtcgaaagaa 4260 
tgaaaattgt gagaaaaat- acacaactaa 4320 
aaaattgtaa taacatggcc aatt tccac: 4330 
attgtttgaa atttgtctca tttaaagaaa 4440 
aatcccagca ctttgggagg ctgaggcagg 45CO 
agcctggcca acatggtaaa accccatct; 4560 
tggtgggggc ctgtaatccc agctacttgg 4620 
gggaggtgga ggttgcagtg agccgagatr 4680 
gtgagtctcc gtc-caagaa aaaaaaaaaa 4740 
tggctcatgc ctgtaatccc agcactttga 4800 
aggaggttaa ggctgcagtg agccgtgatz 4860 
gtgagatcct gtctcaggaa aaaaaaaat- 4 920 
attttaaatt atgaaaactg ttcrgtagag 49S0 
ctttgaactt ctgggctcaa acaatcctcc 5040 
acatgtgagc cactgcacct ggcctaatat 5100 
ataaattaat aacactgaag cttcctgata 5160 
crcactctgt tgcccagact ggagtgtaa- 5220 
ctccctgact caagtgatcc tcccacctcg 5280 
tgccaccaca cctggctgat ttttaaaat~ 5340 
ttattttaaa aatgatatat gtggctgggc 5400 
ttgggaggcc gaggtgggag gatcacttga 5460 
atagtgagat cccatctcta tagaaaaaaa 5520 
attcccagct actcaggaga ctgaggtgag 5580 
acagtgacct atgattgtgc cagtgcactc 5640 
caaaaaaaaa aaaagttcga aaatgcttat 5700 
aaattgtgcc tatatgaaca caactatatg 5760 
aagaaataga ccaaattgtt cacatggttg 5820 
atttgtttcc ttccaagttt atatgttttc 5880 
taatcataga aaaccctttt ttggtccttg 5940 
cttttttaat gagaataaat gttatatttt 6000 
tatgagccct tacaattatt aagaggctgc 6060 
gaaacagcag taattacctc tgagaacaga 6L20 
gttttgtgct tttgccacat gcatttatta 6180 
attgtatact ccatctggtt ggtgtttcat 6240 
agatgatatg tgtttctact tattaacgta 6300 
taataatttc cctattgata gacatttaag 6360 
tactgcacag atagcttttg ctatagtttc 6420 
atgctcaaat agttatatgt ggctcaactg 6480 
ttttgaattc tgaaggggtt gattaaattt 6540 
ggcttcatta gcatccacca gcattgggtg 6600 
caacaaatgt agataacaga gaactatcta 6660 
taatagttta ttttcatgtg aatccagaaa 6720 
ttcttatatg aatagaatca agctatagaa 6780 
agctgggtgg aaggcaggca ttttagtgat 6840 
aactttcttc taatatcaca taatatagca 6900 
tgttaaagga ggtgagatgt cacctaattt 6960 
tgaagctgac tatactctgt ttttaggtca 7020 
gcttcttatt ctactattta actcattttc 7080 
atttttcctt ctgaattact aggttctact 7140 
tttataacct tccatggtct cacttgatta 7200 
tcacacctat aatcccagca ctttgggagg 7260 
gttggagacc agcctgccca acgtggtgaa 7320 
tagctgggca tggtggcagg tgcctgtaat 7380 
attgcttgaa cctgggaggt ggaggttgca 7440 
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gcgagctgag attgcactgc tgcacttcag 
aaaaaaataa aaaacaaaaa attctacaac 
cccttatgag tttaatatgt ttagattata 
ttttgttttc ttatgtttat caagttattc 
tgtgaggctg ggctcaatgg cttatgcctg 
gaggaccact tgaggccacg agttcaagat 
atctctataa aaaaattaaa aaaattagct 
ctactcagca gactgaggta ggaggaatgc 
tatgcactcc agcccgggca atagcaagac 
caatacatat tcattataac tattttacca 
cccagtccca tcctcagaat ggggatctca 
attcatattt tctgcaatta ttaccccaca 
aaacaatgtg catttaacat gtctctctct 
tcctctgttg cagccctgcc agtaagacac 
aaagtggact ggctaggcca ggagtcctta 
tttctcagaa tcagatatat atgtggactg 
ctatacgttt aaaacttata tagatggggc 
acaatacacg agagtgccat gtctttttaa 
tgcatgtttt ttgatgagaa taggctactc 
cttgcatact ctaaattgtt gctagaatct 
atcattaact ttggtgcttt gttctacaat 
gcttagcagg ttacagttct gccctctgag 
cttcctgatt ttcaagtctt aattagtact 
tttgctttga agtgacttta cctgattttt 
gaaactgagt ctctagcttc ttggtgggca 
cttttcagta agggagatat tgaagagaaa 
agggaaatcc tgctccagtc cacaaaagca 
aacatgcaga ggctttggat tttactcctt 
aggaagtaag atggtgactc cagcttatag 
aataggaggg tattattagt tttacttaac 
atttgtctcc agtgtctatt tcagtgtatt 
gcaaaacttc tagaaataat gagaatattt 
atagtcattt cttcttatat tttttactta 
tttgaaaaac atgtcatgct gagatgtatt 
gtttttccta aaatgctgag tatatcaagt 
cacatgaaag actacacata tagccaggtg 
caggaggctg aggcaggagg attgcttgag 
attgtaccac tctactccag aatgggtgac 
agaaagatta catagactac atatacaccc 
acctaaaatg gtaagaagat aacttcttat 
taaagtagtt ttaaattttt aattttttct 
tatcttgtca acaagttgag gtggaacccc 
agaaaaccaa ataagaacta tctcatttaa 
tagctttctc taagctttat tatatattct 
gggccaggca cagtagctca tgcctatagt 
attgcttgag tccaggagtt caagaccagg 
taaaaataca aaaattagcc aggcatggta 
ggctgaggca ggagaatcgc ttgagcccgt 
gccattgtac tccagtctgg aaaacagagt 
attgatagag atctaatgta caacctgaca 
catgttaaat gagtagattt taactactct 
gagatgatgt atatgttaat ttacttcact 
tcataacacc atgtcgtgta tattaaatat 
attgagattt tttttaacta gatatggagt 
gtctgttggt tctaggagct gcatgctgtt 
cgaatagttt ttccaaaagc catttttcct 
atccaaattg gtaggtgcta ttgtaatatt 
tccaaagtag aaatgaatgt gcactaatga 
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ctgggtgaca agagcgaaac aatgtcttca 75C0 
acagggttat -atttttcca - t tttgtt t~ 7560 
aacctgaaag cttgaatacc tatgtctat; 7620 
ctttaaacat tttctaaact gtaagaataa 7630 
taatcccagt gctttgggag gccaaggtgg 7740 
tagcctggct aggcaacata gcaagaccc- 7800 
gggcatggta gcaaatgctt gtagtcccag 7860 
ttgagaccag gaatttgagi gaccta-gac 7920 
cctatctctt aaaagaagaa gatgtagtaa 7980 
ttgaaagtaa aaaatgagtt tttacctttt 8040 
gtagaccttc aggattggaa gaatgagatc 8100 
aaatatttca gatacctttc catgzattac 8160 
ttctctctct ctctgtgtgc gtcttcatga 8220 
tatctcctga agaatcaccg ataggaacag 8280 
gcttcttagg gggcaggagc tgctttgtgc 8340 
aaacatttaa aaacagaata gccaagggtg 8400 
tacattgctc tctattacta atttcccatg 8460 
cttgttttga gcacagacta atcttgttta 8520 
atgagaaatc tgtaaac — a acactagtcc 8580 
taaaatttta gcaccagacg gaccttagaa 8640 
acaaggagat ggaatattzt acccaggatt 8700 
tacccagcac ttccctgtgg gcaacatcaa 8760 
ctgaagaatc ctacttgttt ttaactccca 8820 
ttagatccct tattgcagca atgccactaa 8880 
ggagctgctt tgtgcttgct cagaatcatc 8940 
tctactgagg agtctggggg tgaggcactc 9000 
gagaggaagg gttggttacc tagagtattt 9060 
taatccttgg aaatgcctat ggaaggggaa 9120 
acatactagt gttacatata tttaaactat 9180 
tttcaactgt gaaggattat acttctcaat 9240 
tttcactttt cttgaagcag catgtctgtt 9300 
atatattaga tcaagccata acttgatgat 9360 
catttttaca ttttaatgat tactttcatt 9420 
tttcttcatt ctgtaattag ttatgaaaca 9480 
cttggctaag aataagtaat aaatatttgc 9540 
cagtggcttg cacctgtttt cccagctacc 9600 
cccagggttt ccaggctgca gtgaactatg 9660 
agagccaggc cccatctctc aaaacagaaa 9720 
ccatccaaaa catacacaca catctactta 9780 
tttctaatat atgacacaga aaagtttttt 9840 
aggtatttct caagccatgt tcccatgtgg 9900 
tctcagcaga tgattgggag atactggtaa 9960 
ggttaaatta cttcacaata tcaatgtctt 10020 
gagttggttt tgaattataa gaatgaattg 10080 
cccagcactt tgggaggcca aggcaggtgg 10140 
ctgggcaaca tggtgaaacc ccgtatctac 10200 
gtgcatgcca ttagtcccag tcacttggga 10260 
aaagtcaagg ctgcagtgag tcaggatctt 10320 
gagaccttgt ctcaaataaa aaaagaatga 10380 
actataggta ataaaattgt attggggatt 10440 
taccacaaaa acacaaaagt gggtaactgt 10500 
atagtaacca ttatactatc tatatgtagc 10560 
gcacattaaa atttgttttt taaaaaaaga 10620 
ggacaaaatg taaagtgaat tgatcttttc 10680 
tcccttgaac aacatcttct agatcaaatt 10740 
gtttgggttg atcaacaaac gtacatattt 10800 
tgctgtcata ttctacacta tagcattgag 10860 
gctttatttt ctacacagtt gcactaatac 10920 
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cagctgcctc ttatggaagg crggaaac-g acaccaaact ccttattcag ccaaagacac -0980 
gccgagccaa agagaataca tcttcaaaag ctgatgctga atataaaaaa cttcatagtt ,1040 
atggaagaga ccagaaagga atgatgaaag aacttcaaac caagcaactt caqtcaaaza 11100 
ctgtgggaat cactgaacct aatgaaaacg agtcagagat tccagttgac tcatcatcag U160 
tagcaagttt atggactatg ataggaagca ttttttcctt tcaatctgag aagaaacaag 11220 
agacatcttg gggtttaact gaaatcaacg cattcaaaaa tatgcagtca aaggttgttc 1.2SG 
ctctagacaa tattttcaga gtatgcaaat ctcaacctcc tagtatatat aacgcgtcag .i34C 
caacctctgt ttttcataaa cactgtgcca ttcatgtatc tccatgggac caggaatatt U40C 
ttgatgtaga gcccagcttt actgtgacat atggaaagct agttaagcta ctttctccaa li460 
agcaacagca aagtaaaaca aaacaaaatg tgttatcacc tgaaaaagag aagcagatgt 1^0 
cagagccact agatcaaaaa aaaattaggt cagatcataa tgaagaagat gagaaggcct .1580 
gtgtgctaca agtagtctgg aatggacttg aagaattgaa caatgccatc aaatatacca 11640 
aaaatataga agttctccat cttgggaaag tctgggtcag tataaatttt ataacttggg 00 
agaaatttta tgtggcttaa acatccccaa actatgaatt agaatagtat ttcatatata 11/foU 
aattgaaaat caattaaaaa gaaacacagt gcctaaaggc acttggggga cacatttacg 11820 
ctttgcagta aagtccttgt ttggataaag attgtatgtt ttctggccaa gtaagcttga 11880 
ataggtacaa gcttagatag gttcaggcca gagaggtcaa aattacttgc ctgagattgc ii94J 
atagctagtg ttacaactag gattcaaacc caggcagatt gacttggggg ttcatcagga 12000 
tggagtgccc tacaaagcct cccatcttta atgcttgcag atttgttccc cagttaccga 12060 
aagcaacttg ttaatattag ggaaaagggc cagtgtaggg agagatccac ggcatgaggt 12120 
aaccttcctg ctgcatgtgg tggcacctgg attggaatgc atccaggagc tgcttaccc, 12180 
gccggtgtct gctctttaat ttgtgtataa cggagaggaa gtagacaggg caactagcgc 12240 
tccagcccct catcctggcc acaaatatta atgctacctt tatatgacat aagtcactag ,2300 
tccatttatt ggaacctaaa tttgaaccac tgtaaagtaa gacttcatag tgataaagag .2360 
aggaacttgt taggaaagag aataaaatag aaagagaagg ttgtctcctt ttgtagattt 124^0 
tttttttttc tccaacagtt ttacctgtga cctttataca aataactgac aaagcattaa 12480 
tctctttggc ctacatcatt ttcttttcta tttttttttt ccacaagatg gagtttcact 12540 
cttcttgccc aagctggagt gcagtggcat gatctggctc actgcaacct ccgcctccca 12600 
cgttcaagtg gttctcctgc ctcagcctcc tgagtagctg ggactacagg catgcaccac 12660 
cacgcctggc taattttttg tatttttagt agaaactggg tttcaccatg ttagccagcc 12720 
tggtctggaa ctcctgacct caggtgatct gcctgcctcg gcctcccaaa gtgctgggau 12780 
tacaggcatg agccactgct cctggccggc ctacatcatt ttctaaagct ccagaccatt 12840 
cttttctttt cttttctttt cttttctttt cttttctttt cttttctttt cttttttctc 2900 
ttctcttctc ttctcttctc ttctcttctc ttctcttctc ttttcttttc tttttttgag 12960 
ttagaagctt gctttgttgc ccaggctgga gtgcagtggc accacctcca ctcactacaa 13020 
cctccacctc ccaggttcaa atgattctcc tgcctcagcc ttcagagtag ctgggactac 13080 
aagtgtgcgc caccactcct ggctaatttt cgtattttta gtagggacga ggtttcacca 13140 
tgttggccag gctagtcttg aactcctggt ctcaagtgat ccgcctgcct cagtctccca 13200 
aggtgctggg attacaggcg tgagccactg tgcctggcct cagatcatta ttttctgtta 13260 
gctttaaact gtccgttcag gagatcccac tgcatcctca aattcaaaat atctaacact 13320 
gagcttatga tttagctggt tctgtcatta gatgggaata tccttttatt tccttgaaat 13380 
tatatggtga gaacagggag aagtgctgat ggtaaagtcc tgtgattaag atagcaataa 13440 
ggactccgcc cttcccactc cactgaaggt tgaagagcca tggacaatga gaagtcacag 13500 
taggtgaaat caggtactaa aatggacttg gcttgagaga tcaaaattga tcacttggtg 13d60 
atacaactaa caaattcatg ttaacttgaa cctttattac cctgtgaagc atggtgatta 13620 
aaaaaaaaca acaaacaaac aggaaacttg attgttaaat tctctttaag tcagaatatg 13680 
taccttagag tttttattta tgcttttgtc taccattaat atgtctgcac ctgctcttta 13740 
gaagttaata gagagtaaag tcgtctttat gtctttcagt gcttacttat atttgggaag 13800 
ttgagaaaaa tttttaacat cattattgat atatatatat atatatatat atatatatat 13860 
atatatatat atatatatat atagataatt tttttttttt tcttgagacg gagtcccacc 13920 
ctgtcgccca ggccggagtg tggtggcgat ctccactcaa tgcaagctct gcctcccagg 13980 
ttcaagcgat tctcttgcct cagcctcccg agtagctagg atacaggctc ccaccaccac 14040 
gcctggctaa tttttgtagt tttagtagag acgaggtttc accatattgg ccacgctggt 14100 
ctcaaactcc tgaccttgtg atccgcccac ctcggcctcc caaagtgctg ggattacagg 14160 
cgtgagccac tgcgcccggc tgaggtaaaa tttaaagtgt acaattcagt catttttag. 14^u 
atatttatac tagttgtaca gccatcacca caatctaagt ttagaacatt ttcattaggg 14280 
ggtgggagaa attttactct gctttttaga ttaagtttct gtctggatct aatcatttaa 14340 
tcagacaatc aggcagattg tctgtgatta gttttggcca ttccagcttc ttcattggtt 14400 
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gttaactttc acaaataaag gctgctcaaa gattagaaat aacatttaat ttgaatgtaa 144oO 
atgtgccata gtttaaaaga tgggtttggt gaatacagtc aaatacarac att-aaagc- 
ctaactctga agattatgta aagaaaagga aagaaatgta gggagaggat -gaaatgttc _4d30 
atggtataac aatatctgaa catccacctg grcacaccgt tggtatztga atgtttcgtc .4640 
ctccucaaat tcatatgtcg aaatcccaac tcccaaggtg atcgtattag gaggtgtgg- 14/00 
ctttgggaag tgattaggtc atgaaggtga agccttcatg aatgggattc gtgctcttat 14760 
aaaagagaac tgtgagaaat aagtttctgt cgtttgttag ccacccagtt taggatatt" 14820 
tgatatagca gcctgcatgg actgagacaa ctatgagtta ttatgatagc ttctgttatt 14880 
tcacctaaat tcatagaagc taatatatca atatttatgc tatgaaatac ttcttaacca 14940 
agctttgaat atatttatat ttttgtttat ttttaaattt cagattccag atgacctgag 15000 
gaagagacta aatatagaaa tgcatgccgt agtcaggata actccagugg aagtcacccc 15060 
taaaattcca agatctctaa agttacaacc tagagagaat ttagtgagtt caaatatata ibl^u 
tgttacatca aaattctttt acacgttttg taagatttct agttgctzta gctaagtaat 15180 
aagaatgttg tattcctttt tgatacaaat ctttttttat tgtgttaaac tatatataac 15240 
ataaaatatg ccatgttcgc catttttaag tgtataattc aaaggcacta attacatcca IbJOO 
taatattgta caaccatcac cactatctat atccagaact tttccatcac cccaaagaga 15360 
aacttggtac ccattaaaca ataattcccc gtccactcct ttccccagtc cctggtaatc 15420 
tctaatgtat attgtgtctc tatgaattta cttattctag atatttcata tataagtaga 15480 
agtatgcatt tgtcttatgt acctgactta tttcatttaa cataatgttt tcaaggctca 1554U 
tctgtgttgt atgtatcaga atgttattcc ttttcatggc tgaatactat tccattgact 1d60J 
gcatatacca catttgttta tccattcatc tgttgatgga cacttgggtt gtttccacat io650 
ttttggctgc tgtgaataat gccacagtga acattggtgt acaagtatct gtttgagttc o/20 
ctcttttcag ctcctttggg atatacctag gaattatgtt taactttttg agaagctgag 15780 
aaatctttaa taaatgataa cacaaatact tatatttgcc aatgcaaata tgaatatttt lbb4U 
tggcttttaa gagattgatc attttgccac gtggttgtaa ttaaaaaaaa ttgtcccatg 15900 
ttgtttcagt attaatattg tagcctaaaa gagtgctaga ctgttttact ttttactcag 15960 
ttaattcttt ggatactggt agagtcagga aatgagatat tgaacttaaa gatctttgca 16020 
ggtggggtcc agtggctcac acctgtaatc ctagcacttt gggaagctga ggtgggagga 16080 
ttgcttgagg ccaagagttt gagaatagcc tgggcaacat agcaagaccc catctctaca 16140 
aaaaaattaa aaaaaaaatt aagccaggcg tggtagctca cgcctgttat cccaacactt 16200 
cgggaggctg agatgggtgg atcacttgag gtcaggagtt ggagaccagc ctggccaaca Ib2b0 
tggtgaaacc ccatctctac taaaaatacc aaaattatcg gggcgtggtg ctaatcctgt 16320 
aatctcagct actcaggagg ctgaggcagg agaaccactt gaactgagga ggtggaagtt 16380 
gcagtgagcc tagatctcac cactgcactc cagcctgggt aacagagcga gaccctattt 1644U 
caaaaaaagt aaaaataaaa attagacaca tgtggtggca catgcctgta gtcctagcta 16o00 
ctcaggaggc tgactgaagt gggaggatct cttgagccca ggagttccac actgcagtga lbobU 
gctatgattg tgccactgca ctccagccta ggcaatatct caaaaaaaat ttttttaaat lbb20 
agattattag gccagacgtg gtggctcatg ccagtaatcc cagcactttg gaaggccaag 16680 
gcaggcggat cacctgaggc caggagtttg agaccagcct ggccaacatg gtgaaacccc 16740 
atgtctacca aaaatacaaa aattagctgc aatgtctata atcccagcta cttgggagcc 16800 
tgaggcaagc gaatcgcttg aacccgggag gcagaggttg cagtgagtgg agactgcgcc 16860 
actgcactcc agcctgggcg atacagcgag attctgtctc aaagaaaaag gaatttgtt, 16920 
tcctgtcttt atcgtagagg gaggaaaggg agaatggggt tggaatggtt attgagtgag 16980 
ccacattatg gtagatgtat cactgggcat agagaaaagg agcatttaaa acttttccgc 17040 
ctaacagatg tttcttcagg ctacactgca ctcattgtgc taactgtaat gtcaaatccc 17100 
agacctgtgc ctatagaaca tgaacatcct tcattggatt tgtttggtca ggcttacact 17160 
ttattaggaa gatcagatgt taaaataagg gtgttaaagt taagttcaga tatgaggata 17220 
attcattact attccttttt ctggcagcct aaagacataa gtgaagaaga cataaaaact i/2bu 
gtattttatt catggctaca gcagtctact accaccatgc ttcctttggt aacatcagag 17340 
gaagaattta ttaagctgga aactaaagat ggtgagtaca tttgttattt tgactttttt 17400 
ttctatttaa atagttgtac atttttaatt gttcttgcaa cctgtcatac ctgtgaacag 17460 
tatgtgaata gtgaaatata attatgataa ttaaacagta gtttttatgt attgaaaaat 1752U 
atctttggcc gggtgcagtg gctcatgcct gtaatcccag cactttggga ggccgaggca 17b8U 
ggcggatcac ttgaggccag gagttcgaga gcagcctgcc aacatggcgc aaccctatct 1764U 
atacaaaaaa atacaaaaat tagcctgaca tagtggtgta tgcctgtagt cccagctact 17700 
tgggaggctg aggcagaagg atcacttgag cccaggaggt ctgtgttcct gccactgcac 17/bU 
tccagcctgg gcagcagagt gagaccctgt tggggggaaa aaaaaaaaag tctttaact. i/o^u 
aaataaattt gacatttaaa atcttaaatt atttcatctc tgtttcagta ctaactctgc 17880 
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att-accacc ttctttctaa taggactgaa ggaattctc: c-gagtatag ttcattcccg -J^O 
ggaaaaagaa aaagataaaa atatrtttct gtcgagtccc aatttgctgc agaagaccac i80vO 
aacacaagta atagcacgtc atcgaata" taacaaaata ccatctgtta catatgatzg .8060 
a^aataaagt atgaagrtcc ttgtaacacc ttgcatcgtg aagtgcatta aaaacccccc .8120 
aagagtaagg aataacttga tttaaaatat tctattctgt aatctctrta aattatctgt 18130 
acaaattatt gacttaaccc aaattcaaaa atgaatgcct cagcacaatt aagt-ccaag 18240 
aatagagttg atcatgttaa ctggtaaatg gatcatgact taaaattctt ctaggactga 18300 
aacaaatgaa aacgtagttt taagggtttg attctttaaa ttcctatttt tacatgcaat 18360 
tctactgcac aacccatctt attttgacag ttcctaaatt cgcaactctt cagaaatatt 13420 
atcagatcac ttttctttgc ttccataagt ttt.ttatta ttatatcatt attttttctt 18480 
tttaaaagac ggtgtctcac tttgtcgccc aggctggagt gcagtggcat gatcatggcc 13540 
cactgcagcc tcgacctccc aggctcaggt gatrctccca cctcagcccc ccaagtagct 18600 
gggaccacag gcgaatgcca cgatgcctgg ctaatttttg tatgttttgt agagataggg 13660 
tttcaccatg ttgcccagaa ttgtcttgaa ctcctgggtt caagcagttg tcctgccttg 18720 
cccacccaaa gttgtgggat tacaagtgtg agccactgcg cccagctatt ctagaagtat 1873C 
tttaagagtc atcttttttt tttttttgag atggagtctc acrctgtoac ccaggctgca 18840 
gtgcagtggc acactctcgg ctcactgcaa cctccacctc ctgggttcaa gtgattctcc 18900 
tgcctcagct tecctagtag ctaggattac aggcgcatgc caccatgccc tgctattttt 18960 
tgtagtttta gtagagacga gatttcacca tgttggccag gctgctcttg aactcctgac 1302U 
ctcaagtgat ctgccctcct cagcctccca aagtgctggg attctaagtg taaaccacca 19080 
cacccagcca agagtggtct ttttacaata ttattttttg attaggacat tcattcttgc .9140 
cataaaattg aagatactct agtcatttag aatt-.cattg ttt.ggaacc agacattgtc 19200 
tctttatttt tgaaatgtta ttgaaggaat accatttgga gaagatacaa atgtaagaat 19260 
tgtgaaaagg ataattgtga cacaaatcaa aattatagat aaaaatatac ctgtaaaacg 19320 
tattaaggca ataacattct ttctgcttgt cgaccataaa tacctatatt ccctggatgg 19380 
gtacattgtt atrgtcaagg gtgtttaaat aatgatcttg catgcataat ttattctctc 19440 
tggtataaca gaatcagcaa tttagttttc cgggacccga gaaaaacatg caaaagacat 19500 
actttgaaat gtaaaactga tttttccttg caactgtagg tccttctaga tcctatggta 19560 
aaagaagaaa acagtgagga aattgacttt attcttcctt tttcaaagct gagctctttg 19620 
gggtaagaag ttatggccaa actagcatgt tagacatgtt tttaacacca tatctggcag 19680 
agttttcaat gtaaatatta aagtagatgt caatgtcaat aagtgatctt aataac gcat 19740 
cagtagatat tttttcaagg attgtctcta tcttcacgcc tagcttataa tttgccttgt 19800 
cgtctttttt tttttctctt tatttttatg tttttatcca tccctggtgg taggggataa 19860 
ccttgtcttc ttcgataaca agaagtctga agcttattag aaattttact ttgagaattg 19920 
atcgatgaga agaaagcaac tagatatcac gtggatcata tatgcttgaa taaaacaata 19980 
attcttagaa caaataaata cattttaaaa gttaaagcca aaaacattag ttgaatgttt 20040 
aaaaatattt caaattaagt tattccttca ctgtcttgta ttactgtaat aattcggatt 20100 
atttgtgttt ttctcaactt ttaaaacaaa tatttaaaaa attcctcttt tgattaagta 20160 
gggctagata aaatataaaa aatatttttt aaactcctct taatttccat atttcttata 20220 
taatatgaga atctcttata aacactacct cttagaagcc tccacagaag ctttggtaga 20280 
tgtagtagta gggatttgat ttcttagaat ggtataatct gtaaatgttt tagtaaaagg 20340 
attaaacgat aaagtcaaaa tgtttatagc acagtgttta ttaatataaa ataaaatctc 20400 
tttttttttt tttgagatgg actctcactt tgtcactcag gctggagtgc agtgttgcaa 2046U 
tctcagctca ttgcaacctc cgcctcctgg gttcaagcaa tccttccgca tcagcctcct 20520 
aagtagctgg gattacaagc atgcaccacc acacctgcct aattttttgt atttttagta 20580 
gagatggggt ttcaccatgt tggccaggct ggtctcaagt gatccgcctg cctcagcctc 20640 
ccaaagtgct gggattacag gcgtgaacca ctgtgcccag cataaagtaa aatctcttca 20700 
gactctcatg tgatcatgta aagtggcagg cagtcacagt caagaagtag tttaaagttc 20760 
atgtttgtaa aatataatct acagattgat actggatttc ataggtaatg tttaagagaa 20820 
aataagtttt tagttatcct cagtacttca aaagcaccca cttatgatta tgttgattac 20880 
taaactaaat catttggggg ctagaggtgt ttttttatgt gttaagattc cttaaggagt 20940 
tctattaggg caaaactttt agtaactgca tattttaaaa gtaataaaac taacttcaaa 21000 
agcttggagg ctgggcgcgg tggctcacac ctgtaatccc agcactttgg gaggccaagg 21060 
cgggtggacc acttgaggtc aggagtttga gacgagcctg agcaacatgg tgaaaccttg 21120 
tctctactaa aaatacagaa attagccagg tgtggtggtg ggcacctgta atcccagcca 2118U 
ctcgggaggc taaggcagga gaattgctcg aacttgggag gcagaggttg cagtgagccg 2124U 
agatcatgcc actgcactcc agcctgggtg acagagcaag actccgtctc aaaaaaaaaa 21300 
aaaaaaaaaa gcttgaagtc agattcgaca ttaatcagta cactttctct caagtagggg 21360 
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acaatttcta agattttagt cttttaaaac 
gtctataatc ccagcacttt gtggggccga 
gagactagcc tgggcaacat ggcaaaaccc 
cccaatcagc tgggtgtggt gttacactcc 
aggaggatca cctttgccag ggcgtttgag 
ctccagcctg gatgacacag caagcccctt 
taaattaatt aactacactg ggaaggcaaa 
cctgcttcag tcttttatca tgtaactatg 
ggcgtatcct ccttggagca catcactcac 
ctgatgcctc ttgttgcagg acttaggaat 
agtggttaag gtgtgttcac ttttctgtaa 
gggttttgac catctattat atagggtggg 
gacatatgga aagcattcat ttattcacta 
ggggagtgat gacgaataag actgatgttc 
aattatatgg tttttctttt ttaggctact 
tgttgaacca gccttgcata cctgtgataa 
ctacattgct gagttttatc tgctaatgtt 
agtgattagt ttgcagtttt ctgtttttgt 
aaatctggcc tcataaaatg agatgggaag 
agaggttgta taaaattgag gctgaatctt 
tgtgactgaa tatattggga aticctataa 
aactttagcc aaagcaatct gtaaagaagc 
agttgactgt aaagctttac gaggtatgag 
cattagaaag acaggaatgt tatacataat 
tagtctttaa cttttctgtt tatcatttag 
tttgataaaa tttctaaaac tctccatatt 
aactttttgt agactacatt tctggaagtg 
ttagaatata ctctaattgg tataaatgat 
ggttgcttca ggggagagaa agtaggaggc 
accatataac acttttgtac ttttaaagtc 
aaaaaatatt gggaagattt tactttgaac 
catatagttc caactaatca tgaacttgtg 
gtaactcacc aggaagtttg aagccaaatt 
ctaggcagat gcatttgcat ttgattttaa 
ttttcccaca tcctactttt tttattttgt 
aaactgggta taaatgaata catgcataca 
ttcttttttt ttttttttga gacagagtct 
tgcgatctcg gctcactata gcctccacct 
ctcccgagta attgggacta caggtgcatg 
tagtagagat ggggtttcac catgttggcc 
gatctgcctg ccttggtttc ccaaagtgct 
cctccttttc tgagttttat aaaatttgat 
ttgaaccatg ttgatgaaca agtttttgtg 
ttttatagtt aaatcaatat cgagcttttc 
cccagcactg aaatgatact gaaaccattt 
aaaacataca aaaaacccta gaggtggctt 
ttgtcctgct ggatgacctt gacctcattg 
acagtcctga tgcggtgcag agccagcggc 
ttaaggtctt gttcttttgt cagtcagcat 
cagagaataa tatatgtgtt atgttaagtg 
agttgtccta tagactgtaa tagcaaaatt 
aacttcatgg ttagtccttt agggtttttc 
atttactctt ttgttcattt gacaaatatt 
caaattctag gagaaaaaga agggtgaaca 
ggctactgtg tatgagtagc cagccctttc 
atgaagatat tccctgggct ttacaggtca 
ccagggtgac caacaaggag atgacagcat 
gtaggagcat ataacctaaa ctgggggtga 
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ttattaacca gtctgagca- ggtggcttg. 21420 
ggcagatgga tcacttgagc ccaggagtuc 21480 
cgtctctaca acaaacgcac acacaaaaa= 21540 
cgaagtccca gctacccggg aggctzgagcc 21600 
gctgcaggga gctgggttca caccactgcg 21660 
tctcaaaaaa aaaaagataa aaaattaaa" 21720 
attcagcatt uttLtatagc taaatttcat 21780 
tatattttrt acagaggagt gaattcccca 21840 
agcctcctgg gacgcccttt gtctcggcag 21900 
ggagctctrt tactcacagg aggaaaggta 21960 
catttaataa cttttcattt atctttctrt 22020 
ttttgaccat ctattatata gggtttacac 22080 
atatttctgt gtgtctgctt ttaggtgttg 22140 
tccatgccct ttttctgtgt cagttgatac 22200 
aggtgttgat agggttgagt aacttacaaa 22260 
ataccacgta gttgtggtgt atcattctt. 22320 
ctgttgagct tttgtccatt caagtttgaa 22380 
gttgtctrtg tctggttt-g ctatccgtg" 22440 
tattctctcc tcttcttt-g tttttttgga 22500 
ggtggttgcc acaatgacag gaactatttc 22560 
agcaattatt trctagggaa gtggaaaacc 22620 
atttgacaaa ccggatgccc atgtggagag 22680 
tatggtaaca ctctatataa atcccttttt 22740 
gctgtcaatc taataaatac acatatcatc 22800 
tcattaaaat ttctttggct ttctaatgtt 22860 
taatggaggc ctattttttt ttctagccag 22920 
ctcactgaca ccactctgaa aaattagtac 22980 
ctctgaattg ctatggaaaa ctgggagaat 23040 
tgtggacagc aatgaggaga attacagttc 23100 
cttaacactt acattattat ctattcaatt 23160 
agttaatttt tcccccatgg gtaccgctgt 23220 
tatttcctgt tctttgtaaa tttaaacttt 23280 
tgtgtttcaa atatagcaac tccaggatct 23340 
atgaatcttg atcccttact ctcacttatg 23400 
tgtaagccat ctaaaattct caatgggatg 23460 
ggaattatag tagcatattc cttttctttt 23520 
tgctctgtag cccaggctgg agtgcagtgg 23580 
cccaggttca agcaattctc gtgcctcaac 23640 
ccaccacacc tggctaatut ttgtattttt 23700 
aggctgatct caaactcctg acctcaaagc 23760 
gggattacta gcataagcca ctgcacctgg 23820 
actttactgc acgctttgag actgtattaa 23880 
atgggtatat taataaaata tagatcaaat 23940 
tagtgctttc aaaaggacaa cctgaatttt 24000 
catatcttct gtattaagga aaaaggcttg 24060 
tctcagaggc agtgtggatg cagccatctg 24120 
ctggactgcc tgctgtcccg gaacatgagc 24180 
ttgctcatgg taaatgcatc caccactggc 24240 
ttttagtctt aacaataaat ctactctctc 24300 
ttgtgtttga ggcccctgat ggcattctac 24360 
ggtagagtaa aaacagtgtg aaaattctgc 24420 
attctccctt acttattgtt taatttacag 24480 
tgtcaaatgc ttgtgcacag tctgtattct 24540 
gtattagcgc agaacgatac taataatgat 24600 
ttggctttct tggattgctt tgtattctac 24660 
ataaatggaa attcagagag attaatttga 24720 
acactatgcg agaagtatac acagagtagt 24780 
ggtgggataa ggagttatca gggaaggctt 24840 
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tttggaggag ttgacaactg agccgagttt tgatggaaga gtagaaatta gcat.aa ca -.900 
atttcatgct aataaagaag caaaggaagc gtggtctaca ggcaaaagca cagagq-.au, -.960 
ggaagtaatg atatgttggg gaacaccctg r.cgactggag ctcagag=== aagga.a^ --^ 
gtgcLgggZ ggtgaggttg gagggtttgg «gc.«g.c ttgc»c.«g ; 
gctgaaatag atataaaatg caactaagag tggcttggat ta.tattac- tagtgcgc.a a 
atcLaaat? ttgaaatcta tagcatctat aggactggtg ttactaatct "cactcga, ; 200 
ctgttactgt tcttatacta gatctattag tccagtgttt aagggagtgg tgcagatt -.-260 
taggtcagga caggactcag atgtacatta ttaacgccta tttcagttct sacct.ctca ^320 
ta?gaaacct ta?aagacct ggggtaggaa gagattgttc tggaagtcat aggaa.atga 2 380 
actgtatttt gtttaacaaa caatacagta tggaaattta tcaccct.co agaaua.tt* .5440 
tttcagagac aaatttttat cattcgttca tttatttcat aagatccacg ^aggga-c -3500 
ctcac?agac attgctctga gtatatggtc cgagtttgca gtacctcttg ^ct.ca. 2 560 
aaatttatca ggtcctcaat agataaatca gggaataact agatggat.c atttt.uaaa ^ 
glcatgfaag Scgat.cc. tacatactgc accttaaagg -aaccttag ^ 
tttttaatga atgtataatt tttaaatttc atgtttactt ttcctaag.. tttgcacta. - 
attgEaat tccagctttg aatgatatga taaaagagtt tatctccatg ggaagtttgg "800 
?tacactgat tgccacaagt cagtctcagc aatctctaca cccttcactt gtt-ctgct, ^360 
aaqqagt?" Htatttcag tgcgtccaac acattcagcc tcctaatcag gtaatacacc 25920 
ac??g?aagg att.ttg.a? tatgtccctt ttatagaaat tatttttcaa "ttactagt 2.980 
aattcgtg?c ttta.attta tgcttctctt aatgatttta aggatatgta agt=aac« ; .6040 
tqqtgcatat tgtgctagag gcataaatta taatttatag ccacctgaaa tgttagta.g -oioo 
cgct?;=caa gLLtgLt tttttga... tggtatttct ttgaatgaga aagaacagag 26160 
aqaaatagat agatggcttt taaacacttc attaactaaa cttttttttu ccaccatca. 
a?aatggcac t?ag?cccct ttgggaactc atgagggttt tagtggtagt gagctgaaag 26280 
taata?gttc caggactggc aaacatattc taaattcttt aaaattttca cctagcatct 26340 
aetata ttclgaccct gtgctagtta actgetattg aagaacaaag gtattatatc 26400 
tattattaag gataltagaa tggtatttga gatattggtc attgaatatg "tatgtttt 26460 
gagaaataag ttttatagga accaaaaaaa aattcttaaa ^aaccata, atta.taaaa 26o20 
atgettctta ttggagaaag aaatgacaat catttattaa tgtgatttt. ^cacaactt 26b 
attaagatat aatttaagta caacaaactc acataaagtg tacaatttga tcagt.ttaa 
r-atatataaa tqccatgaaa ccatcaccac aattaaggaa acaaacatt. tcatcactcc uu 
aqaag?c?cc tagccc?t?t actacccatt cctcccctgc tccatcccca gacaactacc 26760 
aI"?octtt ctgtcactat agatttgtca acctgatttt ctccaaatat acattcaaaa 2o820 
Ttatacagtt galtacaatt gga.attcga attttgtgtt tttttcttc. agaacaaaga 2 8 0 
tnt-aaaattc tatqtaatgt aataaaaaat aaattggact gtgatataaa caagttcac- ^ 
aatct'qacc tgcagcatgt agctaaagaa actggcgggt ttgtggctag agattttaca 27000 
qtactcgtgg a?cgigccit acattctcga ctctctcgtc agagtatatc "coagagaa .7060 
2g«SgttIt actatlaaaa cctgaacttg ga.tcttctt tctattgtgg ^""gtaa 2 -120 
ttgt.gtaag acaagaatta aatatattcc attgtagtat ttgaataagc agttatttga 271BU 
gtagaaaat? agtg?ttcca gctaagatga tggcatattt tgaaa.ttca tatagtgaac ,240 
ataactaqta aaagaagttt tgtttatttt taaacagaat tagttttaac aacattggac * 
?tccaaa!gg "ctccgcgg atttcttcct gcgtctttgc gaagtgtcaa =«gcataaa 27360 
cctagagacc tgggttggS caagattggt gggttacatg aagttaggca gatactcatg 2 20 

EES ESSE ESSS EEE2 E~ S ^ 2;js 
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tLattttct tagagaegga gtcttgetat gttgeccagg =agacaga ; c ^aatgtgta I b 
taatacaqtc tttqatgata agaaacttat aatggaaagc tgaggtga.a gttacagcaa * ? 
a?acatt?tg atgtataatt ctgtttgctt taatcattca aattgtagta aagcaagatg 27960 
aactatctgc ?gggatttga gclgaaatgg ataggaataa actaggaggt agaagagtta 28020 
tcaafgttca ca^actgat ggg?gaagct agatttccag accegggatg tcagtccttg 28080 
aaaagcagac ttggcaggca tagacgaggc agatagcagg "aaaggaga ^aatgtaga 2d 
ttottcttca gaagatcaga tggtagagtc taggaggtag tgtgttttaa tcagagatct to 
gaSggcaaa gatcattgea tgagatcagg gacccatgca aaggagtgag aaaaaaaact 28260 
ggJtlLgga gcctgctgca tggcaactcc tgggaacagt ggccactggg gectgggaca 28320 
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tgttgattgc agcccaggac tgttaaaacc agtgtgagag aacatgggta tggaag-act ^338'. 
agctagcagg atcatgaccc cgacgctggg atggggcatc aagcattagt acatggagat 2344. 
rcagtacatc cagatgcagt acacggagac tatatgcg-a actcctgac- ttgggr-.rt: f-^ : 
ctcagaccgg agcagaggta gaggtgagtg ggaatattct caacagaggg aactaaa.ag ^bo. 
gcatacctaa taaaggagac caggatattg cagacagtac cctcatgtct cgctcacc.g 2962. 
ttcaaaaagt tctcttgttc ttgagcagtg gtgccttaaa aggtaact-g agaagcagcc 2a68j 
gattacttgt tcagcctgga gactcttggg atattttact acctttgatt gaataga"t 28740 
aaatgtacac agctctcata acttgcccca tgaagcatat ccatgaaagg cactatactt 2880 
qttaaaagat tggtttgtac tttttaaatg tagtactttt aataaaacag gaaaaataga 23860 
agttctgatg cagttatatg cattttatat agaatgtgtt cttaattgga aaaaat"gt 28920 
cgtagttcct ttgagtrcat ttacagtttt tagtaggaat tgtattttct actgttg-ac 28980 
ttgctgttac taaagaaaga tggtcgtgat taccatctga attttttttc ratacatcga 29040 
tc?ttagctg ctacttagtc atttctgttt agacttgagc tctttttcat attttttr.t 29100 
tttgtttctc agtatccaga attatttgca aacttgccca cacgacaaag aacaggaaca 2916u 



LLLUL t (-^ Ll - dyuQi,v,wuvjw — >- ' -3 - ^ 

ctgttgtatg gtccgcctgg aacaggaaaa accttactag ctggggtaat cgcacgagaq 

agtagaatga attttataag tgtcaaggta tgttgtctac ttatcttctt -.tttta-.-a 29280 

ggtaaaatta acataaatgc agttagccat ttcaaagtgt aaactcactg gcatttagig ..9340 



cattcacaat gctatgcaac caccacctct ctctaatttc aaaacttttt cattcca-tc 29400 
ctcctcttgc ttatcccctg gcaaccattc atctgctttt tgtctctatg gatttgcct, 29460 
ttctgtatat ttcatataaa acaaatcatg caatatgtga ccttttttgt ctggct"" 29=20 
tcacttatgt aatgttttca tggttcatcc aggtagtagc atgtatcagt acttca"=c 29SB0 
tttgcatgac tgaataatgt taccatactt tgtttatcca cttatcagtg gtgaaca.tt 29640 
gaattgtttc taccttttga ctattatgaa taatgttgct gtaaatattc atgcacaaat 29700 
ttctccacgg atatgttttc atttctcttg ggtataaact gaggagtaga attcttgggt 29760 
cttagggtaa ttctctaact tttcaaagaa ccaccaaact gtctttcaca ccaactgcac 29820 
cattcccact agcagtgtgg ggggttcctg attctccaca tctttaccaa "ccat.atg 29880 
tttctcaatt gtgggctagt ctcacatttg gaaagctagt gggagcagcg "tccat^at 29940 
taaaagttgt atgaaattga gtaatgagcc acctctctct tgtagggctt attatgt.ct 30000 
tgcttaaggc aatcttcatg cattgtgaac agaattatac ataaatgctc agataaaagg 30060 
gcaaaccatt cttaaaggga gtagacaact agaggcagga gaccatactg aggcaggaag 30120 
ctggggtttt tatggttctg ttacttttga ctatatctca ccattgcttt tgtcaaagtg 30180 
agac?aggtc taagtttttt tcaggtataa ggtgagtgtg gtaattaagg ggcatgc.ag 30240 
cagatcattt tgggtaatgc ttcacagtcc accactggtg tgtcattgtg gtcgcagatc 30300 
cagtatctta gctgtgtaat ttcagacatc agcaatatta gtttaacaaa gggcaactag 30360 
atLcaagac Laggaatcg tgtattattc tagccttatt caaacttgat ttataaatca 30 20 
gtttagtaat ttatttattt gtttctgtat ttatttttat ttctttgaga tggagtccca 30480 
ctctattggc caggctggag tgtagtgatg caatcttggc ttactgcaac ctctgcctco 30540 
tgggttcaag ct22tc?cct gcctcagcct cccgagtagc tgggattaca ggctaattt: 30600 
tgtattttta gtagagatgg ggtttcacca tgttggcoag gctggtcttg aactcctgac 30660 
ctcgagtgat ctgcccgcct tggcctccca aagttctggg attacagacg -WCtaccg 30720 
tgcccagctc agtttagtaa tgtataactg ggttttaccc agttgtaaat tactctt tg 30780 
tcgtgttttt ttgagaactg geaatgaegg agaaactaaa agtgccaggc tgttgccttg 30840 
ttcc?gttat tt?gccttag tttttttttt tttttttttt ttctctgaga ctgagtcttg 30900 
tcgtgttacc aggctagagt ggagtggcat gatctegget cactgcaacc "tgcccc-t 30960 
gggttcaagt gattcctgcc tcagcctccc gagtagctgg gattacaggc gcctgccacc 31020 
gcacccggtg aatttttgta tttttagtag agaegggatt ttaccatgtt ggccaggctg 31080 
gcctcgacct cctgacctca tgatccacca gcttcggcct cccaaagtgc tgggattaca 31140 
ggegagaace accgtgcccg gtcttgeett agttatttct tgttccctcc tctagtcc.a 31200 
tagttctctg actgtattga ggaaatgtaa ttaaatatta ttatgttaat agatatt-at 31260 
gtggttgaat attagaaatt ccttattttg gtcacatatc ctgatcagta gttggtcttc 31320 
"ggagaLgt gatttttcac tagagatgac tttaggacct attcaggttt "tttaagat 31380 
cccaatttaa ggaaagacta ttctcattat tgattttget atatgeaggg aaatttat,t 31440 
cgaaaggttt «cag£tggc ttttagggaa gattatatat tctctttttt tttttttggc 31500 
cttttcccac atgttctaaa aatgatatat tctttaactc ctatgaaaat acattgt.tc 31560 
agtaattgaa gatgetgatt aaagtcatat ctctacacat tttttaaaat ttgagataga 31620 
tgggactttg tcccttctta caccattcac ttattcactt ggaaaaacta ttatccaata 31680 
cttatgtggc agacactgtt tctggcacaa gggattcagc agtgaacaaa actgectttt 31740 
tggagtttac attctactag tggaaagega caacaagcag atagacacat ccagtatata 31800 



WO 99/67395 



PCT/FR99/01513 



46 



atccactgtc agatggtggt ggtaagtcct atgtaggaag aaaagcaggg caaggaggct 31860 
tggagtaact ggagtgagtc atagatggac ttgtcaggaa agggtctctg aagaggtggt 31920 
atctgggcag agatctaaat aaaatgaagc aacaagccat gagaatatcc gggggaaaat 31980 
gttctgggca gaagcatcaa gcatagaact -gtggtatga tatttattct agcacacatc 32040 
aattttaaaa atgtataaaa gacatccatt taatcata-t aaagatttcc atgattcatu 32100 
tagacttagt cagaaaccaa at ttatattt net ttttaaa taatcttacc ccaactct-a 32160 
ttttacccaa taggggccag agttactcag caaatacatt ggagcaagtg aacaagctgt 32220 
tcgggatatt tttattaggt tggtagccta tgaatgtttr taaagtaact gactctgtta 32280 
ttatttatca atcagtgctt tttttggtct tgttttttga agaactgata tctgaaacct 32340 
gtggtttatg tgaattatta ataagctaga ggacgtggat tctctatttc atcaaataat 32400 
acaaaacatt ttagatatta aattttggaa attatttggt tttg-tttac aatagaaata 32460 
ctcctcaaag tggaatcgaa gtggttattc aaagaaatct cagagtagat tcttatatga 32520 
agcaaataat tgcccctaat ttatctctaa attttgtaag 'ttctaaattc ttttttcccc 32580 
cagtttctaa tttatctctt ataagtcaag agtccatctg gccaatttaa tttcagtgag 32640 
tgtaactatt ttgcatatat taaaaaactg tatatgaata cagaagatgg tatttaagga 32700 
tgaaaataat tattcaaatg tgatagcatt atggggagtt ttaaaataaa agttactgtt 32760 
ttattcttcc aaaaacttta ttataaagta tacagttaag agaatataca taaaatacat 32820 
atgcagctta aggaagaata ataaaatgaa tacttcatgt attcaccacc gagtttacca 32880 
ggaaaaagca taaacaaaat aaacctcttc cacgtaattc ctgggttaaa gagaagttat 32940 
agtggaaaat atttgggagc aaacgataa. gaaaatacta tccattaaaa ttgttagatg 33000 
ttgcaaaact gatttcaagg aaaatttata gtgttaaatg tttagaaaag aaaaaaggtt 33060 
agaagtraac cacttatgta tctatctcat gaaattagga aaattataga tataaactaa 33120 
aaaatatgtt aaaagggaaa taataaagat aagaatgaag tttaatgaaa cacaaaacag 33180 
agaagctcac aaagccaaga tttatttttt gaacaccgag tacaattgac aaatctctaa 33240 
caagtttgat taagaaaaaa gaaagcatga ataaacaatt ttagggataa aaagggaaac 33300 
atcgctaaag atatcccaga aatgtaaaag ataataaggg aatattatga aaatattcat 33360 
gccaatacat ttgaaaactt aggtgacata gacaaaaaca aaattgacca aaattgagca 33420 
aaaaagaaac aaaatctgag tagtcctgta acttagtaaa aattgagtta gaaaagttaa 33480 
agaagtcttt acacaaatca aacatcagac tcagttttct aggagagttt tgccaaacat 33540 
tcaagtagca gataattctg gtctattttt ggccccagaa gatatatttt acttgccatg 33600 
catttaatga gatagctgtt gatttttttc aatcaccgtg acaggtgttt tatattaggt 33660 
gttattcgcc agacatctag tccacctgtt gccagatatg gaattaatat tcacttattt 33720 
tgaattaaaa tttgttaata aattaataaa acaaagtcaa agttcaaatt attaaaaaag 33780 
taaaagaaat aaaatatatt ttatagagag cccttacaaa acagtaccaa cataacgagc 33840 
tttccaaatt ttgaatgggc aaaataaatg aataggcatt tcacaaaaga aggaagggtg 33900 
gccaataagt atatattaat ataaaaatgg ttacttgtaa taggaatcaa aagtgtttga 33960 
cttattgact aagagtcagt ttttgttttg atccctgtta gtctatccag aaggcatggg 34020 
tcttaataaa caccttgacc tcaacagttt actgaataca agggtaattt catatgcctt 34080 
gccttcttta agggtttgtt gtaaagatta aaataaatac ataaatatat ataaatacat 34140 
ttatatgtat ttatatgtaa ttacatacaa cttgccttct ttaagggttt gttgtaaaaa 34200 
ttaaaagaag tatataaata tatataaata cataaaataa atacattcat atatgtatat 34260 
gaaatcactt tgccaactat gaagcctgat tcaaatatga aatgttgttt gtttttccca 34320 
gagcacaggc tgcaaagccc tgcattcttt tctttgatga atttgaatcc attgctcctc 34380 
ggcggggtca tgataataca ggagttacag accgagtagt taaccagttg ctgactcagt 344 40 
tggatggagt agaaggctta cagggtaata attataaata cagaaataga atgttataac 34500 
aaaatgtcat catgtcatca gattttggta aaaaaatgtt cttttttcct ctaggtgttt 34560 
atgtattggc tgctactagt cgccctgact tgattgaccc tgccctgctt aggcctggtc 34 620 
gactagataa atgtgtatac tgtcctcctc ctgatcaggt gacaatttca tatttagagt 34680 
ccaaaaccca acaaatgcta cactctttcc ttgtgagctt tacttctgcc aggtaatggc 34740 
aattgtcctt agaagaccag ctttcttagg gaaaagcttt agccactgtt tgctcaaagc 34800 
ataaaaagat tctgaattag atgcaaagcc tttttttggc ccagtgcaag tctgaaaact 34860 
ttgtaatcct tctgtgttgg ctgattgggg aaaaaaaaat gcaagaaacc taatgtatta 34920 
tattttcaca ttatcttctg ttcaaagatt acatacttcc attatcctgt caaaaaaaaa 34980 
actctgatac agaatcaagc atgtgaatcg taagcatgta agcaggtttc atagagataa 3504 0 
tttttcaact cttccttgtc ctgtgttgtt ccaactctta ttctccaatt tagaagcaaa 35100 
caaataaatg aatgaaagaa cagatagaca aatgaatagt caaaggtata aagtatctgt 35160 
atatatgtta catgtagcta ttatttaaat catttagatt ttccttttga aataccttct 35220 
tggcacactt gcctaaatct agaaaataag cactgtgtga ataagaaatc atttacactg 35280 
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aatattttgt aggtttttgg gtttttgtt- 
ctggagtaca ctggtacgat cacaactcac 
ctccccacct cagcctcccg agtagczggg 
attttattat taatttttgt atagagacgg 
actccagggc tcaagtgatc ctcccacctc 
gagccaccat gcccagcctt aagagtgttt 
ttctgtcggg gaaaaaattc caaggaagat 
ttacttataa agctttttag atatataagg 
aatttaagat aatattttta attttatttt 
ggtgtcacgt cttgaaattt taaatgtcct 
tgaccttcag catgtagcat cagtaactga 
acttcacaat gcccaattgg aggccttaca 
aagttatatg aggaagttgt tatgacattt 
atttccacct taaaaaatgc tattttttaa 
aatttacctt tagtrgaatg ttccatagtt 
tatgaagttt gatgtctgtt tctttaacat 
tttgcaagga tattatttaa attgggatac 
tagagttttt tgtttgtttg tactttaact 
ttgaagctca cattgttcca atctggccaa 
tttatgacat gtcctcatca ttcttgaatc 
tcttggccag gtgcagtggt tcacgcctgt 
aggatcattt gggcctagtt tgagaccaaa 
acaacagagt gggatcttgt ctctgtgaaa 
atacctgtag tcctagcttc ttgggagagg 
aggatgcagt gagccatgct tgtgccactg 
tgcccccaaa aaagaaaaat attcttggtt 
catcagcctt ttctctaaag acagtattat 
tgttacatta tagactttac catatatttt 
accacatttg tttggaatgt ctacagaacc 
ttttgctatt ttggcaagcc attgaagttc 
gtatttgtag agctctctat aatgagaaag 
ggagtagaaa agtatgaatg gaaagtcaga 
cttagcttca ttacagactt tcttggggga 
tgtctttata attttaatag ttaaattttt 
atgagctctt tgaaaaatgc ttctaagttt 
gttattattt atttctgaga ctaaaattgt 
tattttagga tggaagttcc agctctgata 
ttaaccatag cagtggctct gacgattcag 
cccttgtttc tttagagatg tccgagatcc 
ggctctactt tggaagctct tatgaatcag 
tatcttgtgc agtcatcatt atacagttct 
tgcagtgatt tctctcctaa ccagccccac 
aaaatagtct tgtttcttgc ttacactaat 
aagacagggc tgggagcaag gaaccaaagt 
ttgaggtttc tcttacctag tggctttaaa 
aaacttaaat tctgttatca tgaacagttg 
aagaaattcc tgaaaacaaa gtgttatctg 
aagtgtactg ataatgtttc aacaggaaag 
ttctactagc attcaacatc tcttctaaaa 
tacatgtaac atctgtacat gtgtttggtt 
tgctttatta atttaggctt tttttttttt 
cagactagag tgcagtggca caattatggc 
tgattcttcc acctcagcct cctgagtagc 
gctaattttt gtatgttttg tagagacgag 
actcctgggc tcaagctatc tgcgtgcctt 
gagccactat gcctagccta actcagactt 
ccaagaacag taaggtggtg gtttaatttt 
tttagaaatg tcccagaaac ttagtataac 
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ttcagacaag gtctcactnt gtcacccagg 35340 
tgcagcctct atggcccagg ctcaagcaat 3540C 
accacaggca cacgccacca tgcccaga-a 3 54 6C 
ggtctccctg :gttgcccag gctttcttga 35520 
aacctcccaa agtgttggga ttacaggcgt 35580 
gattttcatt cattttccza tatatattar 35640 
aaatagtagg ctgttggtac atttctcaac 35700 
ttaatttatg aagaaaatca caagatacac 35760 
ttatttgtta aataaatttt tctcctttca 35820 
cagtgactct ccacctctgg cagatgatgc 35880 
ctcctttact ggagctgatc tgaaagcttt 35940 
cggaatgctg ctctcgagtg gactccaggc 36000 
tatgagtgat aaaagaagta caatgtcaaa 36060 
acaactttgg taaaactgta tagaaacata 36L20 
ggaatatggg ttttgcagag aatttataat 36180 
taccttaata ttggcaaaaa catgttggtg 36240 
catgaattaa atactacaaa caaaaataat 36300 
'ttaaaaaat aatcagttaa agttgttgtt 36360 
-aggagcccc ttttgtatgg ctcctgtatc 36420 
acttcctcac ttccagatac agtaagttat 36480 
aatcccagca ctttggcagg ccaaggcagg 3654C 
ccatggttgc acaaactgta cccactatgg 36600 
aattcaaaaa ttagctgggc atggtggcac 36660 
ctgtggcagg aggatcgctt gagtaaatcc 36720 
cactccagca tggatgacag aatgagaccc 36780 
tatcttgtac tttctgtatc ccagccctag 36840 
gattttaata tttacagtag atatttgaac 36900 
ctaggaagga ttattctatt actcttcttt 36960 
tacagtttct aaatcagaaa ctccctaggt 37020 
ttccctctcc ctttactacc agaaaggtgt 37080 
cactctataa catggttgat tcatcatttt 37140 
gacataaaaa taaagcccag aggtctgagt 37200 
tggttggtaa attatctaca cattctatct 37260 
accatgtgcc ccaaaaccgt tagagaatta 37320 
cttgtattgc tctaatagaa tgctatctat 37380 
ttacatcttt aaactggttg tccttttgtg 37440 
gtgacctaag tctgtcttca atggtctttc 37500 
ctggagatgg agaatgtggc ttagatcagt 37560 
ttccagatga atcaaaattc aatatgtacc 37620 
aacttggaaa tggaacctct tctgatctgg 37680 
gaaatataaa gctatatgtt ggtgtaaagt 37740 
atattcttcc tggttggttg gttcttcagt 37800 
tggtaatttg cattccttgt taagattttc 37860 
agcgcgtggt tgtgattacc tttggtttct 37920 
acatctttag gagcagttcc attttatagt 37980 
aggataatga ataatttgat acaataatgt 38040 
tgatactttt gctgcatagt aagcacaatg 38100 
tgttttgatt aaatgtgggc agtatcactg 38160 
attaatagtg gttcactgta attttattgg 38220 
atctatatgt ttcctggttt tttgtacatt 38280 
ttttttttga gacagtctca ctctatcatc 38340 
tcactgcagc cttgacctcc tgggcttagg 38400 
tgggactaca ggcacatgcc accatgccca 384 60 
gtttcaccat attgcccagg ctggtctcaa 38520 
gacctcccaa agtgctagga ttacaggtgt 38580 
taaaaatata aaagcaattc atttttattc 38640 
agtctttaat tctgttttca atttattcta 38700 
tttactttct gaaaatgaag aaacctgtcc 33760 
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ttgggcatta gtgtgttgga tttaagcaac 
caattttcac ttgatggtgg ttctataaca 
acaacttttc agcttgctta atttcagtta 
tttattgctt aaaatgttta atttttatat 
tcttccttcc atctttcatt actacaattt 
ccaagctcca tgactcagga tttgcctgga 
cctccagtgt taaggacagc ttcacaagag 
gatcaactga gggcagatat cagtattatc 
tggctttttc cccctcatta taattgttaa 
tatatatttc tttgacttat aaacgagcta 
actcagtcat ggttatgtgc ttccttgctt 
acgtatggtc tcttgaaaaa actgacaata 
tttacatcct taatttaact cttcgtcaat 
tgaaccaacc aggaccaatc aaaaccagac 
cacttggtca cacaagacca tccattagtg 
aagtaacaga ttctgttttg gaagtacagc 
aaacctttaa agttcgtgtt taaaataaaa 
aaatatgtgt cgtagctatg cattaaaaaa 
attgagtttt cattaaccag ttcatttgat 
taattttagt aactttgggc tgggtgctgt 
aggccaaggc aggtggatca cctgaggtca 
gaaaccccat ctctactaaa aatacaaaaa 
tcccagctac ttgggaggct gagacaggag 
agtgagccga gattgcacca ctgcactcca 
ctcaaaaaaa aaaaaaaaaa atttagtaac 
tgaaagtgat tctaatgtat agtttataaa 
caaaataatt tatattaata ttttattgac 
ttcatttgtg gaccacattt gttatacatt 
tggccaccta tgcatctgag acccatggac 
tgattcaatt taagagatgt ttattcctgg 
attttgcagt actttgaagt atgtatgtat 
aaagaagaat cagaaaacag aggtaaggaa 
ccacctccca aagcatattt gtttatatgc 
agtctgtaca tattgctata tagcagtccc 
ttacatttta aatgttaact actttattgt 
ccacaatatc caatttttag acatttaaat 
ttgcagctga atatatgcac atatctaatt 
acagggagct cacatttttt aaggcttttg 
actgcaccat cactaacatt gtgtgttgca 
tagaaaaatg atatcaataa tttacatttc 
catattattc attgtcattt gtattttatc 
tccgttttct attggagtgc aactttattt 
aatttttttt tctagtttgt tatttcccgt 
acaatccatt atcttttgtt ttgtaatggt 
ttttttcaga tatgaaagct ttcaaaatcc 
gtttcgacct ggacagaaag taactttagc 
gttaagtttt ttgatggctt ttccatatgt 
ttcttcttaa tttaacaaat ttggttaatt 
ttatgtaatg atcaggattg agattaatac 
tccatatttt atttcctaaa atctaaattc 
gtggaactaa tttatttctt ttgaggaaaa 
tcttggaatt cccagttgta tattcatcac 
gcagcttctt cactgttttg aaataaaata 
ctttgtatat caaaaaatgt gaaatttaca 
aaccagaaat gaaatcacat ccctctacta 
taaatgacat ccattcctct cctagttcca 
tatgaactaa attataaagt tagccaccat 
tatatagtaa tggggtaagg gaacagcaaa 
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aaagttaaaa aaacctaccc tgtgttatgg 38920 
caggtatcag tgaaccttta taaaagacga 38880 
attaacatgt atacttatct atgttaangt 38940 
ttggtaaaca gatagttttt tctctccccc 39000 
accatgcaga gctcacaatg tctctctgca 39060 
gttcctggga aagaccagtt gttttcacag 39120 
ggttgccaag aacttacaca agaacaaaga 39180 
aaaggcagat accggagcca aagtggagta 39240 
aacttcttaa aaattgtttc acccttttga 39300 
tatttataaa caagggacca gaacacatta 39360 
tcaatgtttc attatcttat aaggaagaga 39420 
agaagtaaca actggactac cacatttttt 39480 
ttcttttttt acttaaggag gacgaatcca 39540 
tggctattag tcagtcacat ttaatgactg 39600 
aagatgactg gaagaatttt gctgagctgt 39660 
tactattaca agtgacatag tattacactt 39720 
atattttgaa tatttaaaag ctaattcaaa 39780 
ccccaaaatg tcagaagtac agaagtcaaa 39840 
tatatttgaa ttattcataa tggactcatt 39900 
ggctcatgcc tgtaatccca gctctttggg 39960 
ggagttcgag gcaagcctaa ccaacacggg 40020 
ttagccaggt gtggtggcat gtgcctgtag 40080 
aattgcttga acccaggagg tggaggttgc 40140 
tccagcctgg gccacagagc gagactgtgt 40200 
ttcgaagaaa taagaaggaa aattaaaagt 40260 
attttgttat aaaaatacct gttttgcctt 40320 
ctcaagaaca tttaaataca ttcagattta 40380 
ggatttaaag gatccttgca attgagttta 40440 
tgggaaccat tctaggtcaa tgattcagtg 40500 
tctttagaag ctgctacctt ttgttatcta 40560 
gtgtacatac gttagtgcta tgtatttatt 40620 
aaataaggaa acaaatttct gttaagccca 40680 
ttatatatgt tttcctatta tggtaagaac 40740 
cctttatcca catacatcct gaaaattgtt 40800 
ttttaaatgt cattttatag tgtagctatg 40860 
tgctcccagg caatgtggta atgaacattc 40920 
gtttcactag qatagaggtg gaattgtata 40980 
aaatgtattg ccaaattgcc tgccagatat 41040 
gtatttttct aaacttggcc cttttgattt 41100 
tttgattaaa gtgtagaagt tataattttt 41160 
ttttctaact tgtctcttca tcccctttgc 41220 
gtaagaattc tttttaattt ctgtgactgg 41280 
tcatttctta aaatataatt gtgtttgcca 41340 
agtatttata catattaaat tatctctttc 41400 
aaagaggaga aaaaatcaaa gtggaacaat 414 60 
ataaaatata cttctttttg atttggttct 41520 
tgtaacagga aaaaaatggt gtctatgaat 41580 
tataaaatca cagattggta aatgctataa 41640 
tgtagtataa attgggacat tataacagat 41700 
agtctttaat gaaataatat tagccaaatg 41760 
gataataaag aatgtaatta aatttaaatt 41820 
ctttgtagca tttgacaaat tttatgctta 41880 
tcctattacc tactgataca attatctgtt 41940 
cataattcaa atacatttaa ttatccgctc 42000 
tactacatcc agctccaagc ccaagatatt 42060 
gttatgattt tatcttgata ttctctcata 42120 
caatacaatc tgcgtatcta atatcttaac 42180 
aaggagaaca ttaattaaaa tatacaagta 42240 
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agcctgggca acatagtgag accccatctc 
atgcctctag tcccagctac ttgggaggct 
ttcaaggttc taaaccagca aagctcagaa 
atcactagta ttaaactgag acacgtcacc 
atgaaatcac tgagctgaca tacctgccct 
gaagcaatgt ctatgggata gcctaacaaa 
agggtggtgg tggtaaaaat ttggagaaca 
ccctccagga aggacaaatt gctgcctgct 
cctgccgtca gacttgggct gttctctcct 
gctgacaagt aggctgtcaa tatagctggg 
ccacattgtg gaggccacat ccctgcactc 
tggggtggct ggaaaagaca gccgattgac 
ttagtataag cactgaaggc ttttaactga 
ctttgggccc attccaagaa ctctgggcat 
gttctttcca aatttctggt catctggtta 
agatttttat atcagacatc tctacctcct 
attctgttcc cctggaagat ttcctgtctc 
agcagtaatg ctttcactct gatgggaagt 
gtgttagtgc atacacagtg tctgataatc 
gaagaaggct tggagaaaag aagattcatg 
tttctctggc tcttcattct tagtctgacc 
ctatattgtg gtgactcaaa ccaggccttt 
agaatcaagt aggatctttg cccatgtatt 
caatgactgg aggaacacca gggtccttgg 
aggcctctga gcccaagcta agccatcctc 
gcctgaagta accaaagaat cacaaaagca 
tgacattcca ccattgtgat ttgttcctgc 
aattccttct cctggctcaa aacctccccc 
cctaagagaa aacccccttt gattataatt 
gccccacccc tatctccctt cgctgactcc 
tgaaataaac agccttgttg ctcacacaaa 
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ttaaaaaaaa aattagccat gcatgatggt 42300 
gaggtaggag gatcacttgc tcccaggagg 42360 
tcccagggga tagaaacaaa gacttagtgg 4242C 
ctgcattgca ctttgtttct cagttctttg 42480 
cttttcacca taaagtgagt ttcatgatca 42540 
caatgtaaaa accatttagt aagttcatga 42600 
tacaaaacaa atacaattcc aaggtgtgtc 42660 
ctgtgataga agaggatcag atgtaatcaa 42720 
gggtgtggac ttgcctggtt ggtcactgct 42780 
ttgtcatgtc agctgtggtg agggggaagt 42840 
ttggccaatt tgaccatgaa tcttaagcac 42900 
atccatacag aggtcatctt' gaccacttga 42960 
gcattcacat aggacacaaa tattctgatt 43020 
acttttcctc cagacctcat acccagttgt 43080 
tgttattagc cactatctgt gaatcagcat 43140 
gacagaatgg aggagatatg ttacttaaca 43200 
cactgtttgt aagggctact ccctcaatgt 43260 
cacagtggaa ttctgggtct ccaagaatta 43320 
cccagagtgt ctggtgccct tggatcctgt 43380 
gcaagaactt gtgatgtgat gacagggcct 43440 
taggtgtgag aattaggrca ggggccatga 4 3500 
gtttactaac tgggagattt ttacattgta 43560 
ttggtcttaa gaacacaaat gatatggctc 43620 
tctcacgctg atttagataa aacgactgtc 43680 
ccctgtgacc tgcacgtata catccagatg 43740 
gtgaaaatgg cctgttcctg ccttaactga 43800 
cccatcttaa ctgagcgatt aaccttgtga 43860 
actgagcacc ttgtgacccc cgcccctgcc 43920 
ttccactacc cacccaaatc ctataaaatg 43980 
tttttcggac tcagcccgcc tgcacccagg 44040 
gcctgtttgg tggactctct tcacacggac 44100 



<210> 64 
<211> 16869 
<212> ADN 

<213> Homo sapiens 
<400> 64 

aagctttagt agagatctca aaaatggttg gatggtagca aattactaag aactctcaaa 60 
gtttctaaag ccttagtttc agcttgctag aaaacctatg ttgagtatta tggctagttc 120 
catagttgag ttgggaaatg tctttgagga gacacttttt cactttgtat tcatctgtac 180 
attttctgtt acttgcattc tgtcatgctc aggctattag agcaggtaca tttttataac 240 
tggaatgttt atgtgtagtg aagctctgag aggactttgc attagatctc agcagcataa 300 
tcagaaggtt gtcctttgtc tcagcaattt ttaagctaat agtagcagaa attgcagtgg 360 
aaatagactg ctttgccaca acattcagaa aatcatttat ctttttattg cagttcttgt 420 
caccaaacaa tacattttag tacttctcaa attgcagaac tctcataggg ctgggaaaat 480 
gcctgtagac acatacatac tatgaatgtg ctaatgtttt ttgtattttc atagcccatc 540 
aaagctcctg agtcagtttc cactataatc actgcagaat caatcttcta caaggtaagc 600 
ttttgtagag ttactgaagg aagagttggg cctagtgggt aatgtgccac taaaatgttg 660 
gattagtcta aaggtctctg ctactcttta tttgtataag gtgtgattat actttttgtt 720 
cccttcttag ctgttttccc ccataagtgg ctgttattaa aacatctcat ctagagctga 780 
agtgggagga gaaagtgcct actgacacat gatgtgagga tcttaagtat ttttttttag 84 0 
tgtagattgt aggaattatt cttaaaatgc tgattgtata gtgtggagcc atggaagact 900 
gagccgttag tgcgatggca ttgaagaatg agaaggacag agacaggatt tggactagta 960 
gaggttgtcg actgtggtgt caaatgggta gagtaggccc agagattcta aaatgccttt 1020 
aagtggagtt gagctgagta agggcagtag tgaggattaa cacctactag aaattcatag 1080 
tgagaggaat tccaagatgt tttgataaaa gaatgaggag gtcaggtttc ccagggccaa 1140 
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agtccatgaa catctgatac ctcagtgaga 
agtcttagga aaggaattag aacatagacc 
ggcagcaacc attgaaggct atttggtgtt 
tggtgtgagt tagtacttta tacttgaccc 
ccttaagtat actttttttt aagcccacaa 
aggggtacac tggcattccc cagcagggct 
cacaggcaaa catctctctt atttttccaa 
agtttagcaa acagttgctg tgtatcagtg 
agttcactct atgaggtgga tactactatc 
agcgaggtta attaacttgt ccaagatcac 
tcatgccaga gcttaagcct agagcatagt 
gctatgtgac gaggaccaac ctctctaatg 
tcactacctc agtgggtcaa atgaaatcat 
caatgaatag taggagttat cacatcttcg 
ttaaggccag aagcaacttg ttgagctacg 
tctccatgga agggtgtgtg ggacctgtta 
ctgccaccca tgtttattaa atgataagga 
tgcaaatgcc cagtattgta gtggctatca 
tggcaagttc aagaggtcac tgccagccac 
ggagcctgag tgggagccac tggggatcac 
atggctgagt ggcctccctg gagcatggca 
ggtgatgcct aaactagtgc tgttctcgtg 
atcctctcag caaatgagga gactactcag 
tatgtgtaca caacacagca catattaata 
cactggaatc tttcactaag acattgtttt 
agtagatgtt ttggattcat attcattcag 
gtaagcctat gataagcaag tattctcatt 
gacaaacaaa ccataaatgc aaactattta 
gaggaaggac cagctattga tgggtaggaa 
accagaccca tccgtagtga tccagatgaa 
tccaccagga aaaaactcct ggcctatcag 
atttcctcaa aagtgttttt atggttgagg 
agtccctgtt tcaagggaag cagcaatgaa 
atcttaccaa gaactatacc cacttaagga 
ccattatggg tgttcagagg agagattatt 
ggatggatac cagagtcata gggaggattt 
ggtataaagt ggaacagaaa tgaatgagac 
gtcctgttgt ggaaggatat aaaactcaac 
ctaggagatg tacagcaggt tgaggtaaac 
ttttggtttg aatttgtttt ggtttgaatt 
tggggagggt ggcatgtaga atgcattctt 
agagaaaaga ctgctgagct gatgtaggag 
agccgtttaa ccttactact gcttcatgac 
cacagaggat ttttagggcg gtgaaactat 
tgggtacatg tcattataca tttgcccaac 
cctaatgtga actctggtct ttgatgatgc 
gtgtaccact ctagtggtgg gaggggttat 
ggcaggaagt atatgggaaa tctctctact 
tctgtaaaaa ataaagtcta ttttttaaaa 
caaaatactt tatgaacaaa tcttttctcc 
atgtgtatgt ataattttca ttcaaacgtg 
aaacactgat acattagact atctcgaaca 
acctattaag gttcattcat agctgtgatg 
ttctgtttcc cccagggagt atattaccaa 
caagatggaa agccctacta tgctcaaatc 
aagagtgcag cactgacgtg gctcattcct 
cccgcctcct atatcatagg taagtttgac 
aactctccaa tattatgtaa aagagtgtgt 
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gaactgacag aitgttgtgt ttaaaccags 1200 
cccaaggctc ggcaggcctg gcacggcaca 1260 
tcgggatctg aactgtcatt taggggacag 1320 
aggtggactg agaaactcaa gtgatgatgc 1330 
tctatatagt cgaagtctgt tcctcccaac 1440 
gggaaaaacc aacaacaaaa aaagtctgca 15C0 
catrraatac attgttaata aaatatctaa 1560 
gctgagcatt ttgcatgctt tatttcattc 1620 
cccanttcct agatgagaac attgaggcac 1680 
atagccaaca agccatggag tgaggcagrc 1740 
tcctggctct acagctttag caagtgactg 1800 
tctcatctgt aaaataggaa ttgtaaatag 1860 
atgtgttaag cacttagcag agtaagcact 1920 
tatttgtgca ttaccttcac agtttacaca 1980 
ggtttagtgt actaacagtt tccatgtgtg 2040 
ttgtgactgt ctgtactttc gtattgttgt 2100 
caataatgca acaaagtagt caagtaatgt 2160 
cagcagtgcc actggcaggc agcaccatgg 2220 
tgagciagag cccagatcag gcatgcaaga 2280 
ggccaagagt gtgaccaccc aagacccaga 2340 
grggcagaac aactccacga actcagatct 2400 
tggacccctt "tctctacca gaaaccttga 2460 
atcagtgact tagtcctgtt tggtgttata 2520 
aatacctact atgtgccagg cactgcctac 2580 
tactttgcat ttctgccttt acactatgaa 2640 
catacatttg aatatgctgt gttatgcata 2700 
tagaatttgg gaatattgat tatacatgtg 2760 
tatgataaat aactttggac tgatggctgg 2820 
ctagcaagta gcggactgtg gcctgcatag 2880 
acagccaccc tcagacactt ggacaaaggg 2940 
gtgctatgtt acagttcagt tactggaagt 3000 
tacacattcc tacagcttta cctgctgcca 3060 
ttacactgtt cccgtagtca aggacagtat 3120 
ggtgctggat gccataaaga tttggatcaa 3180 
tccagctcaa gacccaggga agaggacata 3240 
aacacaggac atgtacacat tagttagttg 3300 
acaaagcctt gaatgccaga aatactagta 3360 
tgggagtgga agagaaaggc agcagtgagt 3420 
atatcctgaa gactataatc caaagattat 3480 
catggtatct attttctttg agtggatggr 3540 
accaaatcag catgattttc aagacagtac 3600 
ctttggctgc agtctctatg gctttcagca 3660 
tgtggctaac aaagtaggga tagtacggag 3720 
taatactctc tttgtatgat actataatgg 3780 
cccacagaat acacagcacc aagagtgaac 3840 
tatgtcagtg tacgttcatc cgtgtaacaa 3900 
tgataatagg ggaggatgtg catgtgtggg 3960 
tctgctcaat tttgctgtaa acctaaaacc 4020 
agtggggatg gtattacggc aatataaaa- 4080 
agatgtaaac tgtcatatat gcaccctcgt 4140 
aaacaacttt agaattggca ccaaacatat 4200 
ccttttactg accactttga aaacttgctc 4260 
ttctattttt attttcaatg tgggattatc 4320 
attggtgatg ttgtttctgt gattgatgaa 4380 
agaggtttta tccaggacca gtattgcgag 4440 
accctctcta gccccagaga ccaatttgat 4500 
aaatggcaca ggtttttttt taacttagtt 4560 
tagtcagctt gggctgtcag gacaaaanat 4620 
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cacagactga gtggcttaaa caacagaaag 
ccaacatcaa ggtgctggca acacggattt 
tggtcacctt cttgctgtgt cctcacatgg 
tcttcttata aggacaccat tcctgtcaga 
ccttaattgc ctccctaaag gtctcatccc 
caacatataa atttggaggg tggcgggggg 
atgagtatta ttaagtacaa aaaaattaga 
gtagctggag tgtgagtgct accagttatt 
agtggtatgg ataagatttt ttnggagtga 
ttgctcagga actaggttat ttaggttact 
aggaaagaac tatcccagtt atcccatact 
gctacacatg tcatcttagg cctttatagt 
tgtgcttttg ttaatttcaa agctgccaaa 
ctgattaata caatttttaa agttttcaga 
tctgcagtga gcatgcatca ttacttttgc 
gagagaactc cagggacaaa taatatacca 
tacattacca aacaattcta gccttctgct 
tctatggatc aggatctcag cagaggcagt 
tactgcctcc tctttctaat ccccagattc 
gcatggcatg aggtcagaac accacttctg 
atttaccggc catgtgactt tggcaagttt 
tgtaaaatgg gaataataat agtgcctacc 
tgatacatgt aaacttagag cagtgtgggt 
actgtttttg ggagaatgcc atattcttta 
taatttcaaa gtaatgcatg tttcaagggc 
cccagtgtct agaaatttta acatcttatg 
aacctttccc ttggctgcct tccagggcca 
ttggaatttg tttgtcatgc accttctgag 
acagttccca ccagaccaga gaagggctac 
ataacaatta aggaatcagt tgccaaccat 
aggcctggtg tggtggctca cgcctgtagc 
gggcaatgga gtcagattct ctttcttaaa 
ctaatattct tagtaccaca agatatgtca 
aaaagtgact aaaaagtttt tctcctgcta 
tggtcactta gaaaattaaa agggataggg 
agcactttta gaggccgagg caggcggatc 
tcaggagttc gagaccagcc tggccaacat 
aaattagcca ggtgtggtgg catgtgcctg 
gagaatcgcc taaacccagg aggtggaggt 
ccagcctggg caacagagtg agacccttgt 
ggcacagtgg ctcacgcctt taatcccagc 
tgaggttggg agttcgagac cagcctggcc 
tacaaaaatt agccaggtgt ggtggcgcac 
ggcaggagaa ttggttgaac ccaggaggcg 
gcactccagc ctgggtggac agagcaagac 
aagggataga atataatgaa atatattttg 
cctaggcaaa agctgtaatt tccagagaga 
ccattattta tttctagaaa ctcataaaat 
taattaaggt atagatgact gaccaagggc 
tcataaagcc acacaagcct tatgttctca 
gctttaacca taagaaaaat gattggtgga 
ttcatctagg ccacgtgcgg tggctcatgc 
tggatggatc acttgaggtc aggagttcag 
tctctactaa atatacaaaa attagttggg 
ctcgggaggc tgaggcagga gaattgcttg 
agatcgtgcc actgcactcc agcctgggtg 
aaagaaaaaa ttttaattta atccttctgt 
tcttaataaa gctgctcttt actgtttcta 



tcactttctc acagttgtgg aggctgaagt 4680 
ctggggaggc tttrcttcct ggcatataga 4740 
cctrtcatgg agtgagagct ctttggtg_a 4300 
cgagggcccc accctcatgg tttcatttaa 4860 
caagtaccat cacattgggg attagggctt 4920 
ggatgcaatt cagtccataa caaaaaaagc 4 980 
gagctttata gaaaatatga ggcattttat 5040 
t-gagttaga gcaacgtgca tctactaaga 5100 
cccagggtta aactgtacta caagaatgta 5160 
tatttataca aacctattca aaaataattt 5220 
tgcaaattct caatatgtgt gcctctgcat 5280 
ataaaggctg atagttgaaa tggcagctgc 5340 
acagttgtga gatagactca caagaattta 5400 
tttttacagt tactrcagac tttttacctt 5460 
atcctgagaa caagcataag tgtgtttttg 5520 
ctgttattct cacctatatg tcaagttrca 5580 
tataagtata tagaattttt atttacctta 5640 
gatgtatcag aatcaccttc gggattcctc 5700 
tgatatgcat ccttgtccta cagcgaggca 5760 
gagccagact gtctaggttc acagcctgcc 5820 
cttagtctct cttgcctcac tttcctcaca 5880 
tcagaaggtt gatgtgagga atgaaggtat 5940 
acaaaataaa catgatgcaa gtgttcaacc 6000 
agccgttaaa gaagaaaaaa tgattaagaa 6060 
taatgccagg ttgctcccag agtggtctct 6120 
aaaatgatat atacggtcaa aaatgtattt 6180 
gaggaagatc ttccaaggaa gatggaatac 6240 
tatttcaagt cacggtcatc accatttccc 6300 
atatggactc atgttgggcc tactcctgca 6360 
ttgtagttca caaattaaaa ctgggtttcc 6420 
cccagctatt gcaccactgc tctccaagcr 6480 
aaaccacaaa aaaactggat ttccagttct 6540 
taggtatctt taaatgaaat tcttagctgg 6600 
cctagtaata aacaaatcat tgtttattac 6660 
ccaggcacag tggcttatgc ctgtaattgc 6720 
acctgaggtc gggaagtgga tcgcctgagg 6780 
ggcgaaaccc cgtcgctact aaaaatacaa 6840 
taatcccagc tatttgggag gctgaggcag 6900 
tgtagtgagc caagattgca ccgctgtgct 6960 
ctcggaaaaa aaaaaaaaaa aaaaaggctg 7020 
actttgggag gctgaggcag atggatcgcc 7080 
agcatggtga aaccctgtct ctactaaaaa 7140 
acctgtagtc ccagctactc gggaggctga 7200 
gaggttgcag tgagcagaga tcgtgccact 7260 
tccgtctcaa agaaacaaac aaaaaattaa 7320 
aacttaaatt atattctata tgtgtatctt 7380 
ccattaggaa caggtagtat ctatttttct 7440 
ggattgtatt tttctataag aacaaaatat 7500 
ttaatcaaat aaaatgacta acagcatcta 7560 
tctcaaaaat gctgtgacag ctttttggct 7620 
tgattttatt agcccaggct tttaaaaact 7680 
ctgtaatccc ggcactttgg gaggcctgag 7740 
gaccagcctg gccaacatga tgaaaccctg 7800 
tgttatggtg catgcctgta atcccagcta 7860 
aactcgggag gtggagattg cagtaagccg 7920 
atagagcaag actgtctcaa aaaagaaaaa 7 980 
agaaacaggc attcagaacc attccattga 8040 
gtcaaaaatg agacttcgat caaaccataa 8100 
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gattttatac tgcagatagt cagcttcacc 
gcttcctgct tgatagtctc ttgactacca 
cattggtagg ccactagcat tgatatcttt 
acccataata agaggcctgt tgtatatgaa 
cggttaagta agggagcaac acgtaaaatg 
ctcttttgtc ctgatttaac cagcattttt 
tgattgtaat gattttgagc tgcagcagct 
ggtgtttgag ttggaaagaa acaactatag 
tcacaaaggg tatagtaaaa ttgattgtaa 
tttggattaa aatgtatttt tcaccgtgca 
caatttaaat ggggctcttt aaccaaaaat 
agaatttgga gtagaggccg ggcacagtgg 
gctgaggcag gcggatcacc tgaggtcagg 
cccgtctcta ctaaaaatac aaaaattagc 
gctagtctac tcgggaggct gaggcaggag 
agtgagccga gatcgcgcca ctgcactcca 
aaaaaaaaaa aaaagatttt ggagtagatt 
atcaaaaaat ggctaataaa atgaacacaa 
aaaaatctat aaattgatca tctgtttata 
aaataaagat tgaatttcac ccagtgtgat 
ggccggacct gatatggccc tggtctgtgt 
atctttcccc tgtatgcccg cccaattttt 
ctccaattct accttccaaa ggcctttctt 
tccagattcc catgcctttt tggaatcaat 
ctacttccat catcctcact cctatccctt 
tatttactca tctttgtaac ttccacataa 
ctgattgtag ggtctgagtt agatactgtt 
taattcatat taactttggc tgaaactttt 
tagattgtta cattctgggt tagtattaga 
ttttaagatg agttttaaat agttctctta 
aggaaattat cccaaaccat tccagttcct 
gttttccact tcagccgtaa gtaggtgaaa 
tttgctttat acacatgcat gtgtgttgtg 
tgaagtttct gtcatgccca gaaaagggag 
ctggggatgt ttgaagaact gtgctgttta 
ggtaggaggg tatacctcct acacccaaga 
agaaggaacc caaatgaccc acaagaggtg 
tgcacagtaa tttatttaag cacctcttaa 
agcggaaagg ttcacaataa ataagagaaa 
ttctgcaaac aagaagcatc ttttataaaa 
gcctgtaatc ccagcacttt aagaggctga 
atgattgtgc caccactcca gcctgggtga 
aaaaaaaaaa aaagacggaa attcctccag 
agctactttt ttcagcttta tacttcgcag 
ttttccaaat tttttacaat aagcacacac 
aactggtggt gaacaaccgc tggcttttag 
gtagttctta aacccttgaa agggagtgaa 
tcattatttt cctatattca catcatgatt 
agcttcagcc actcctgggc caggcgcatg 
ttctgcaggg tgcctgtatc atctgaattg 
ggttcaagtt tttctttcct gtcctccact 
cgctgctgac ttaaggcccc aacaccaaac 
agcaagctcc aacaattgtg taaggtaaag 
tcctagtggt tctgtttctc tgatcgaatt 
agagaaggca aggaactact gtttctcatt 
tttgctatga atatgtagtg ctttgataca 
cacataggga aagatagatt ggattatttt 
gaataaaatg ggagaaacag ctccctcatg 
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aaagccgcag aggaaacatg tcgagatcag 8160 
ttaaaacgaa tattgggagg tcatgaaagt 8220 
aaaacatcta ccctaaacca tctgctatgg 8280 
attgtctaga attcaggtgc aggtctttgc 8340 
ggagaggagt ggggtgtact cacttgcctc 8400 
caaccctggg aaaatttgca gaatctaagt 8460 
ttaactctta ccctttttcc acatagttat 8520 
gtagctacac gtacataact atctctttat 8580 
ataactttct aagtgccaat attcaaaact 8640 
tttactttgg atgtatttar ttcatttaaa 8700 
ggtatttaaa accaaaacag tatcgtactt 8760 
ctcacgcctg taatcccagc actttggaag 8820 
agttcgagac cagcctggtc aacatgaaac 8880 
tgggcgtggt ggcgtgcgcc tataatccca 8940 
aatcgctgga actcaggagg cagagactgc 9000 
gtctgggtga cggcatgact ccatctccaa 9060 
catcattaat aagtaacaga ttttaggaaa 9120 
tgtaaaacat ttatcaaaat gtagactttt 9180 
aattggcaga tggttgtgta ccatctttta 9240 
ggttcccatt gcttatattt ctcctgctga 9300 
tcccagcctt gtttcctcat taccactaaa 9360 
ctggctctga gtccttgttc atactgttct 9420 
aacaccttcg gattctttct ttgagaactt 9480 
ctctatccta ttgtcatcac atttaagttt 9540 
tggtcctggg atgacaggga tgctgtgttt 9600 
cctaaccccg gttcttgctt atgggagatg 9660 
aactaaaatg cttgttgata ttttagttat 9720 
aaattctatt gtgaatagtc aagtaaaatt 9780 
ttgtttttaa gattgtttta aacaagatgt 9840 
acacaaataa agcttaatat gagtatttga 9900 
ggctgtgaaa ggcttttcca ggcctaataa 9960 
tcaaatgaac aatagaggga aatgtattta 10020 
tctacatata aacattgcac acgcttagaa 10080 
aggcattttt gtggattttg tctggctgcc 10140 
cttcatacca ggtgtgtgag ccataccttt 10200 
aatataagcc aggagaaggt ctgtgccaag 10260 
ggccattaat tattgggtca gatgcataaa 10320 
tggtgaccca caaggaagat tgctcgtagt 10380 
aaagcagaac gtagaactgt atgatagcaa 10440 
gatggaagga gcccaggcac agtagctcat 10500 
ggtggaggat cacttgagct gcagtgaccc 10560 
tagaagtgag accttctctc aaaaaaaaaa 10620 
aattttaaca tgtcaacaga ggttttctgc 10680 
tattttccaa attttctcta acaagcagta 10740 
acacacacac gtttgtttgc ataagtgccc 10800 
tctatacata tctagaatat tttataaata 10860 
tgaccagctg agaaaataaa gtcagtgatt 10920 
ctaggaaaga acttgggagt gacttccttc 10980 
cttagctctg tggtaaaggt caccagcttc 11040 
gaggtttggc gagggtaaga gactgatgta 11100 
tgaaatctgt cttcccttcc agactgcctg 11160 
acagaagcaa cagccttaca cagagtgttc 11220 
tttcctttat agattccttt tctatatcgc 11280 
ctggctgata acagttgctg agactctgaa 11340 
ataaactgtt tagaattatt tggccatctt 11400 
ttttttaaat caaaaagtaa tgaaagagat 11460 
taaagtttat atactaaatt gaaaagcaaa 11520 
tggctgttgg caggaagctt ccattcctct 11580 
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ctgtgggcct ccacaggttt gctcacagca aatggtccgt gacagaaaga cgcaagggca 11640 
gttgcaccca agatggaagc caccatcttt: tctataacct aatctgaaag aagggacata 11700 
ccagcacttc tgccatatgc tgttgggtca cacagaccaa ctzctggtaca gtgtgaacac 11760 
aggaccacac aagggcgtga attccaaggg cagagaccac tagggaccac ctcagaggca 11820 
cagagggaca ccctatccag ctggtggcca atgtaaatta acatagcttt ttagaatagc 11880 
aatatgtatc tataatctta aaagtattaa aagtacttct tgatccagta atttcatttc 11940 
taagaatcca tgctaagagg atttaaaatg tggaccaaaa aatgggtata aaaagaagtc 12000 
gttaacagta tttaaagttg tgaaaaacca gaaacaatct aaaggtccaa caataggaaa 12060 
atgaattttg atatttttct aatagaattt tatgctgtca tcagaaacac catttacaaa 12120 
taatttttaa taacgcaaaa aaaagtttat aaaatgttca gtgtaaaacc tggacacaac 12180 
tacataatga ttctgatttt gtaaaaaaaa aaaacaaaaa cacacacata tacacatgca 12240 
tacatatgca tataaagaaa actggaacaa acaaaataac aagcatagtt ggaattacag 12300 
tcattttaat attctttatg cttttaaaaa ttttgaagtt tgtattacta gcatccacta 12360 
cttacgtagt caggaaaaaa atacaacttt aaaatagata tttaggtcca aagatggtaa 12420 
tctaaatggt gttacaggct gaatgtgtgc ctgatcccca tgccccaagt tcatatgtta 12480 
aagccctggc ccccaaggca atggtattag gggagtaggg cctttgggag gtaatcagat 12540 
ttctacgagg tcatgagggt ggagcccgca tagtggaatt agtgtccttt taggaagagg 12600 
agaacagacc aaagccttcc tttctctcct cactatgtaa gaagacagcc agaaggtggc 12660 
cacagccagg aagagagctc tcaccagaac ccaaatctgc tagcaccttg ctcttgggtt 12720 
ctcagcatcc agaactgtga gaaatgaatg tgtgttgttt aaaccactca ggctacggta 12780 
ttttgttgca gcagcccaag ctgacagaga tagaaacaac acaaggaccc atcagcagac 12840 
gaatggatga tcaaaacgtg gtgaggtcgt gcagtgggat attattcagc cgtagaagga 12900 
atgaaattct gatacatgct ataatgatga accttgaaaa catgttaatg gaaataagcc 12960 
aaacttaaaa ggacaaatat tgtataattc cacttatatg agttagttac ctagaatagg 13020 
caaattatgt catagataca gaacattaga ggttaccagg gttgtgggaa gaggggtatt 13080 
gtgggtacaa attttcggtt tggagtgatt ttgaaaaaat tctggaaatg ggtagtgaca 13140 
gtagtcaaca tgatgaatgt acttaatgac actaaattgt acacttaaaa atggttaata 13200 
ctgggctggc gcagtggctc atggctgtaa atcccagaac tttgggaggc caagacaggc 13260 
ggatcatgag gtcaggagat tgagaccatt ctggctaaca tggtgaaacc ctgtctctac 13320 
taaaaaataa aaacaaataa aaaaaaaatt agccgggcat ggtggcaggc acctgtagtc 13380 
ccagctactc gggaggctga ggcaggagaa tggtgtgacc tgggagtcgg agcttgcagt 13440 
gagctgagat cgcgccactg cactccagcc tgggcaacag agccagattc cgtctcaaaa 13500 
aaaaaaaaaa aaaggttgat acctgggtgc ggtggctcat gcctgtaatt tcagcacttt 13560 
gggaggccaa ggcaggcaga tcagttgagg tcaagagtta aggaccagcc tggccaacgt 13620 
ggcgaaaccc catctctatt aaaaatacaa aaattagtcg agtgtggtgg tgggtgcctg 13680 
tagtcccagc tgctgggagg atgaggccta ggaattgctt gaacccagga ggcagaggtt 13740 
gcagtgagtt gagattgcgc cactgcactc cagcctgggg gacagagcga gactcagtct 13800 
caaaaaaaag gttaaaattg taagttttgt tatgcatatt ttaccataat ctttaaaaaa 13860 
tagatatata ggagataaag tcaacagaat ttaataacca gttgtaaata gagactgagt 13920 
gaggaggatg aattaaggaa gacattgagt acaacttttt ggtaggtgaa aaactcttaa 13980 
aaaaatacgt gggcaaagat cctacttgat tcttataatt taaaaatctc ccagttagta 14 040 
aacaaggcta ggtggagatt tgcatgtgat gtgaggtgtg tgttctgttt tgtaatgtga 14100 
ggactgtgag ccatctcctg gacttgaata tccattagat aattgaaaat acggatttga 14160 
gaactcagga gacgtgcaat gcagtaacaa aactctgcac ctagttgatt tctgtctcct 14220 
aatttaatgc ttttatggga caaactgtta ggcaggtggg caagatggac agccatattt 14280 
ttgtgggttt ctggcctgtg ggccagcctc agtgctcact ctgaggtcat gtccaaactt 14 340 
agaacacatt caggcctacc acagtcaagg ctccctttct caactctagt cctctgcaca 14400 
aatatccgaa gcctagaaat aataatcatc tgtccttgtg tcttgcatta tgaaagccta 144 60 
ggaaagggcc ttgggaatta agaagaatgg aaaaactggt ctaactgctg catgcttcag 14520 
cttgcagggg aatcactgaa atggggacag gccataaaag gacaaccaga agagtggctt 14580 
cagcaaaggc atcgtttttc agagcaagct agagaatcct gccagcgtcc tcaggcaggg 14 640 
cccctgggca cagaggttag gcaagggagt gtcccagcat gttgatgccc tgagcatcag 14 7 00 
aataatgcca tagaggagct tccaaagagt tcatttcagg ttttgtaagc cgaacatttc 14760 
taggcaaata aaatttgatt ttgtgaataa agcttgtttc ttcaactcca gtgcagattc 14820 
tcatagattg atagtggctt gtgatccaga taaagaaaac aatttttcaa agattcatat 14880 
tctttgtaga tgtacggatt tagagaccat ctaatctaac tccctcattc tacagatagg 14940 
aaaaatgagg cctaaagaag ttaagaaaat accatggaaa tgtcactgct gaactgccat 15000 
acgtaggatc cgaaagaaat tgggtaaatg ctactgtgag aaatacagta ctaggtccaa 15060 
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agaatctaat acaaattaaa aatctaaatg 
aacttacata gt ttcattt t ctttctttt= 
gtggctcatg cctgtaatcc tggcactttg 
caggagtttg agaccagcct ggccaacatg 
aattagctgg ctgtggtggc cgctgccrgt 
agaattactt gaatctggga ggtggaggtt 
tagcctggat gacaagaggg aaactccatc 
aacctgtgtt gtttattaaa catgacagac 
aaaaagctac aatctgccag gcatggtggc 
caggttgggg gatcacctga ggcctggagt 
ctcgtctcta ctaaaaatac aaaaattagc 
gttactcagg aggctgaggc aggagaatca 
gagccaagat cgcaccgttg tactccagtc 
aaaaagaaaa aagaaaagcc acaaccttaa 
ctgattagaa gagtggaagt ggggaggttt 
ttctccccat gaatagtgaa ggtgtgagtg 
aacaggttct tgcactgtca cccgggctgg 
gcctccacct cccaggctca agtgatcctc 
cagttgtgca ctaccatgcc cagctatttt 
ttaggctagt tctcaaactc ctggcctcaa 
ttgtgattac aggcataagc caccacaccc 
tgctgttggg gaaatataat ttaaaaaaca 
atgaaggcag tagagaaaga taagctttat 
gcacatcaca ggcactttgc taagagatca 
acagccaagc aggtacagcc cattacatgt 
gagaacttga cagcaccact ggtcacacag 
gaccacttgt gttatctaag atatcaactt 
ttactrttat agcttggtgc aaggtactca 
actggaagat aggtatgcta tctggtaatg 
ttcctaggtc ataaagctga caaaaggctg 
tgtatttca 
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ttatttctaa agcanccctrg cacatggctg 15120 
tgtugaagaa gaggcaartg gcrgggtgca 1513C 
agaggccgag gcgggtggac cacctgaggt 15240 
gtgaaacccc atctctacta aaaatacaaa 15300 
aaucccagct actccagaqg etgaggcagg 15360 
gcagtgagcc aagatcacgc cattigcactc 15420 
tcaaaaaaaa aaagaaaaaa agcaatcact 15480 
tggcatgaag taattaccaa actgtaaaca 15540 
tcatgcccgt aatcccccac cttgggaggc 15600 
tcaagactag cctggtcaac atggtgaaac 15660 
ccggcgtggt ggcacatccc tgtaatccca 15720 
ctcgaaccsg ggcagtgggg aggtigcagt 15780 
tgggccgaca gagtgagact cggtctcaaa 15840 
tcccaacttc tcacaacatc atctctactt 15900 
attacaaaaa gactgttata ccttacacac 15960 
aaaaagacag caattttatt: ttttttttga 16020 
agtgcactgc tgtgatcac- gctcactgca 16080 
ctacctcagc ctcctgagta gctgggacca 16140 
tttrtaagag atggggtctc actatattgc 16200 
gcagtcctcc gaccttggcc tcccaaaggg 16260 
agccagcagt tttagaaiaa agggtgaagg 16320 
aaatcttctc tcaacccaga aatcctctcc 16380 
tattgaataa aaattaaatg agaatgtgat 16440 
caaagacaga aggaaatttc accattttgt 16500 
atgttttcga gataaatagt cctcaactaa 16560 
ttcattctaa ctttacctga taattgatgt 16620 
ttcgggggtg ggggagtgtg gaaacaggag 16680 
ttaagattag gctgttaccc tcccacagaa 16740 
tttacatttc ccagatcctt gagaaagaca 16800 
attcagtttt taaatatata tatctgtata 16860 

16869 



<210> 65 
<211> 15000 
<212> ADN 

<213> Homo sapiens 
<400> 65 

gatctcttga tcccaggagg tcaaggctgc 
gcctgagtga tagtgggaga ccttgtcttt 
agggcctttg accactcttg agtagaagac 
gaacaaagtt acttgaaaga tctcttatta 
aacacacaca cacacacaaa cctcatctgg 
ggttccttag gctgttatgg aacaaccaaa 
tattttattc ccctcaagca cactatgctt 
ctaggaacag gctgaaatgg tctaatcttg 
ttctaaaaga gaatggttat attcgctgtt 
gatcccgtat taccagacaa taatccccta 
ttatgatctc agactttaaa agatggtctc 
gcatcattaa tgtctgttta cttatcaaaa 
acagtccaat ttatttaatt gaaaagattg 
cctgtgtttt ttcctgttta ggttattgga 
acacgttttg gacccctaat aggtgaaatc 
aacaggaaat atttttggag ggtaagtaag 
gaaaaaatgg agctaaaaga gctgggtggc 
tggggctcac ccataagtat ccagcatccc 
atgaaaccga tgaaatgtct ggcctgtagg 



aatgagccaa gatcaagcca ctgcattcca 60 
aaaacacaca cacacacaca cacacacacg 120 
tcgagaagaa caaagtagaa ggccagagaa 180 
aagagaatgt acaagctatg aaaaaaaaaa 240 
aatgaaaaaa acataatgca tttggtttct 300 
gaacattatt ttggtttctg aggtcagaac 360 
atggtttgag ggagaatgag aaataggaaa 4 20 
accatctaat tctgcagtgt cttattctca 480 
ctagcataaa aagtaatgat aaaaataaaa 540 
gactgtttta atgcttggtt gagtatttgc 600 
cccctatggt gaagcttgtt aattatgtag 660 
ttttatcatt gttagttgta ttactacttg 720 
gttaacattt tatagtcaaa gtaattgttt 780 
gtgatgagta aagaatacat accaaagggc 840 
tacaccaatg acacagttcc taagaacgcc 900 
ggaaatttct tcagacccat taaatgttag 960 
tcacctttct catcctgtgc tgagaaatgc 1020 
catggacaca gggaattctg aacaaatgtg 1080 
tggttagtga tggagatacg ggctatatgr 1140 
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gaatcttgat ttttgcaatt cattagagct 
ctttaaggat aggttcatt- gcatttcccc 
tagatttcac ccctttttga tttct tgctg 
acaaa-gaat tatctttttg gttctttmt 
gctggagtgc aatggcatga tctcggccca 
ttgtcccgcc tcagcctccc gagtagctgg 
attttcgtat ttttagtaga gacggggttc 
tggacctcgt gatccgccca ccttggcctc 
ccgcgcccag ccaggaatga caaatgaatt 
tagctggaag atgggttgag gggaatggag 
gtgcatggta aaatgattcc atttgacaat 
gcttaacagt catatgcaag atgataagct 
cagtacaatt tcctttgcta tattagggtt 
tggaatcctc gaataaaaca ctggattagc 
ttcttcccat agatgtctca gggatattta 
cgtttttttg tgcatactta catgaaatgt 
ctgcatgata acaaaaattg tgttatgctt 
tatatcgttc ggacaagaag ctattcctaa 
cattttraga aatttatctt actattcccc 
agaatcatgt gctcacaatt tttattraat 
ctgacttaca atggtggaac catgagtgca 
cagaagtgag ccacaaaggt gcatagttcz 
agcataagtc tcattaatgt gtgattattt 
ccccctcact gtccagttcc ctgtttcatt 
ttccttggga ggatttattt gaatcagtct 
cgtttttgct ggcaggaata tgaacatctg 
tacactgcca aagaagggat gttcaagttg 
tatgaaccag cgcattttaa tcttctagat 
aacggtgttc attttacata tgcgttattt 
cattgctgtt tttaaatgag gatacagtaa 
aacatacccg tagctttaga aagcagtttc 
accccatgtt cctggaagtt tgcacatcag 
gcagaaitca cccagccttg ttccattttc 
caagctgctt tgatgaagcc acatgtattt 
taaaagaaag tgattctggt gtttaccgcc 
tctgataacg tttgagcgaa atacagaaac 
gtaaggaaaa gcaataacct gctgtccggt 
ttactgctgc ttggagactg caagtcgcag 
gaaatttctt aaagtctaaa gtaaaggtgg 
ctttgtgtgg aaggataagg agtgtgttta 
ttcttcttcc tctgcctctt tgccaagtag 
ttactctagg acaaacttca aattcttcat 
tcttcctgtt ctttttccaa aaacacacgc 
cctcctccca gataaggggt tcccttccct 
gacatgttta tcaagaggaa aagtgacttc 
gcccgagtgt tcgctttgtt atggcaggtg 
acaaaaaggc aaggttccaa gtattcatat 
tgggggtgga ggatgtttgc atagttgaag 
acagaggcca tagaaaaagc taagactcag 
cccagtgact caaagcacta aaagtcagca 
atttgccatt cactgcagta gcaaaagtag 
agctccttaa atgaacattt gtgtttcatt 
gataaaactg aaatggaaaa ggtaactgac 
tttctgctga ttcaagacta ttctggctaa 
taggggatca gaaatcacac acggtaccgg 
tttgggtctg acttcctttt acatgcctgt 
ggagcttcac cacttcattg acggctttaa 
gaatccagca cactctcccc gggagcaaaa 
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ttgtaatgaa aggaaacag- ttgttgcttg 12C3 
gcaaggaagr agtaatgagt caccaagcc- 1260 
acttaacttr aattgaatcg aagagttzat:; 13 2 0 
ctttgagatg gagtctcac. ctgtcaccag 1360 
ctgcaacctc cgcctcccag gttcaagcaa 1440 
gaccaaggtg cgcgccacca tgcccagtta 1500 
cactatgttg gccatgatgg tctcgatctr 1560 
ccaaagtgct ggaattacag gcaagagcca 1620 
accttataag caaatgcca- taaggaagga 1680 
gaccacagaa ctagtccra. t-aaataca. 1740 
aggttaatta tctcacagca taaggaaaac 1800 
ttcctatagc atccaaccaa aagatctagc 1860 
agaaaggccc ccagaggtga accaattaga 1920 
agtgaacaga aaaaagtcag atcgccttcc 1950 
gtttcctcag aagataaaga atttagtaac 2040 
acattatttg aattctt caa aaagaaacac 2100 
gctttagctg gtatttttgc ctagaacgar 2160 
gaaacaatat ttttaatcca ggaagttttu 2220 
aagcaaaaga gggtagttae agattcacta 2230 
aattattcct cct-aaaata tattaatcac 2340 
tttttgcctt tatcgtcaat aacgtcttct 240C 
tggagttaaa ggtctgaatt aagacaatcc 246C 
tgagaaaagg caagaagtac ctaagaatct 2520 
taaagattca ccgtaagtaa ctgaaaggcr 2530 
ttcacatgca aaggatattg tagaacatct 2640 
ttgtgaggaa agaaaaagtt tca-gcaaat 2700 
agaaaccagt gacatttcct gtaactgtac 2760 
aatatatgga agtgcaggaa ggtggtagga 2820 
tattctgtgt gagtgacttc atggcaccga 2880 
attgcagtcc gaggaaggct aactggaatc 2940 
cgcaccagcg aagagtacaa gagcgatgga 3000 
agtaaacaaa cttgaaaacc cctcttgata 3060 
tcttaacaaa acacaccgca aaagctctca 3120 
cccccttcac aatttacagg aagttactct 3180 
tgtgttaaag ggacagagtt cctttttatt 3240 
tatctgtaga ctagcatagt cggtacgtga 3300 
gagcacaaaa ctcctgctac gaacagtgcc 3350 
atcacactag gtattgactg attgtataag 3420 
tacctcctaa aaagagggga agagagaaaa 3480 
tagtttcagt aagagtgtac gttttaatt: 3540 
cctgagtgca tctgttatcc agaagtagta 3600 
tctgcgtcgc ctttaaggaa caacatactt 3660 
ctatggctct gtgtgtggtg ttttagccag 3720 
cctttgcatt gaaaggaaag tgcaagtctg 3780 
tcagtaatag actgtcaaat tcgggcrgc- 3840 
aagttcacct ttgccccacc cagtgtttcc 3900 
gaacaagtgt tactttagga cttggaggg- 3960 
ccttgggcgg gggtgtagga aacggcgagt 4020 
tttgacgtcg tcagccggct tggtcttcta 4080 
taatcggaac tgaagtcagt agcatcgccc 4140 
tactctgtgg tgggttaatc ggrttgaggc 4200 
tttctgttat tttcccgaac atgaaaagac 4260 
aaaagtgtgc cttacctgtt tccgccctga 4320 
actgattgga ttctttttct aactaggcag 4380 
ctgtgtttat tctgagaggr gctggggagc 4440 
cttctctttt ggacagatcc atcccagagg 4500 
tgaagagaaa agcaactgga tgcgctatgt 4560 
cctggctgcg tgtcagaacg ggatgaacac 4620 



WO 99/67395 



PCT/FR99/01513 



56 



ctacttctac accattaagc ccatcrcctgc caaccaggaa cttctcgtgt ggratrgtcg 4680 
ggacttzgca gaaaggcttc actaccct~a tcccggacag cigacaatga tgaan — cag 474 0 
taagtggatt acagaacaaa aaaataaaaa acqccagtaa tgtcggtcc- qcccczzzga 4300 
actaataaca tgttgtttaa ttatacggct tcgtcacgtg t-ggatgaag taggcggcrc -3S60 
aagctaggga ctaggaagag gaaaaacatt ttttgagtcc ccattaacta ttaggaaac- 4920 
tgatcaztta aaagtatata tatatangag gagccacctt gagtti tgaa ttcagga^gc 4930 
tacaggaaga aatatatgtc caactctaat t-atccaaaa gcagtcggga gaartacagg 5040 
gattgg.cca gacatgctgc gtatgcaagg tatagccctc acctgtggra ctttggcagg 5I0C 
gcttagaccg catcaaaata tttatagatg taca-ttgag tgtacagtta ggatctgatg 5160 
tggaacattg taagatcatt gctagaaaaa ctttgtcata act t t tcaat attatrccaa 5220 
gtgaataacc gtaaagattt tacatcttag cctccttcct tacagiaaaa aaactarctg 5230 
atctct-gat cagtattata gtagccacc- accactttat cctaacaaat tczcaazzcc 5340 
ttaggtztat gtgcttttac ttcttttacr tgattaaaat tgctgtca-g acctcretct 5400 
gcagagggct gcatcatttt ggccattcrc aagtgatctc tttgagcaat ttaagaatcg 5460 
ccataagatt ctaacctctg ctgtaactat ggttgtgtgt tcttggttag accacraaa: 5520 
cttatcagca gttttaaaaa ttattcctic tggtttagaa gttaagacca aatgc-gaag 5580 
tttttgcaac ttttggtttt gatatcat't caaacttaag aaaacatttg aagaaaagga 5640 
caaagaattt ccacttaccc tttacccagg tttaccagtt attgataagt atatccattt 5"? 00 
gctttaccag aaggctaact tgttttagtt ctcattttca cctctgagac atttggaata 5760 
aatatcaatg ttaacaraaa ttggaatttt gactttgatr ttaggaccaa tgaacaagcc 5820 
aagtac-tac cctagtcata tataacccaa ctgtatggtt attzggtant ca:tccacac 5880 
ttcat tttac ttgatctccc ttaagattgc aagattgtgc ttgcagtttt tc-gaaaatc 5940 
tggggctata aaagcatcag gacctccccc gtaggggagg tcgtgtgttt ggggtcctta 6000 
cacaacaggt tacccttgag cttcaggaaa agaactggct ctcagttccc cagttccagc 606C 
ttaatgggtc taattaggtc ctgaccaaaa aggtggcagt tcttttccct cargtctctt 6120 
cagcgctccc cgagactctg gagactctgt catatcccta gggctgagcc tcccaggaac 6180 
cattcggctg ttgtggcatc tgtgtatgcc atgcccagtg ctgaggacct agtaacaaac 6240 
gacaaatgca caggcacagt ggcatttttg tggaactcgt attccagctg tgcgtctcag 6300 
aagaagcgca cagctccctc ctggctttct taacatagtg agccacttcc acttaagggt 6360 
ctccttacat tccttgagtt taatcattca cggattcaga ggaaagtctt ttgatttttg 6420 
cttttcttta aacagttcat ttgaggtgac ctaccccagt gactttgcac caaccaccaa 6480 
gaaacttttt tgcatgcttc ccgcaccctg tgccaatcaa gggaagggtt taaaggcctg 6540 
gcgttttrat tcctcaaaga aaggttttgc acagtatttt aaggttcaag tgcttctact 6600 
ttgtgttcag aagcaactgt catatatact gtgaaatgac accttttatt tatcccttct 6660 
tatttatgca gtatgtcccc ttttattttg gcagaatttt ttctaaatgg tggtttaaca 6720 
ttttcaagca catttcattg tccaatattc atagtaaaga atgagagtta acaataacca 6780 
gtcacactaa aacaagattc ctgctgccag ttgtgaaacc ggttgtctta ggcgtggcag 6340 
ctgatgattg agactgtgat caggaaaatt tccactattt catcaggcct aataggtaga 6900 
ttgtgtctcc aaatgaactg tgttgggttt ccatgcttaa agcacaatag aggtggtgca 6960 
agaatctcca tgagggctta aatggcagtg atggttcagg cggtagagct tggagaagaa 7020 
gggatttgaa acaaaccaaa ggaaagaaaa gtaagtagcc agaaatcaca aaatggcatt 7080 
tttctaaaaa caaaggaaaa ggaataaaag aactaataag tttgaaaccc ctacccctcc 7140 
caaatttggc agggggggag gtattttttt tctatctatc taactaaccc atctagaaaa 7200 
cagttgacca aattatagac ttctaaatgt taatctgctt tctcagtttc agttgaaaag 7260 
agactttgtt ttgcctactg cagaacttct aggttctttc ttatagtctt ggggttctta 7320 
ttatagatcg aaaatgtgag tcggcataat taagccattc ggagtcttca gaagcagttc 7380 
actcttgaaa tgactccgtc cgcctacagc catttaagat ttcagaacaa aaacagatct 7440 
tgattttctt tttcatgtta actcaagctg ttgctgagtg ggagagtcag aaatgacacc 7500 
agctccactg attactcagc cgctgaagga tgatttttta aaatgcacct ttactgtata 7560 
tggacttcct aatttccacc tgtagagcat cttagggagg ctaacatgtc actctggatg 7620 
ttcttttaga ataagatgca aatctatttt tcrgaaggca ttagagatag caaacattta 7680 
ttgtgagttt actatatact aggcactgtg ctaagtgttt tgcatagaaa gtttaaaatt 7740 
ctggcttttt tgttggccca atcataagtt tcatatcagt tcaacattca aattatatca 7800 
aggtacttaa gaagaatccc tggctaaatg tgaggggcag tgccacagat ggactgaaac 78 60 
tttatgctta ttgcacattt atgctattat tatttgttga attatagaac caagggagtg 7920 
tggaagccac tggaaaaaat atgagactta gatacataat ttgagtaaaa atggctcaaa 7980 
gtcatgaggg taaagttttt tgtatttcca ttttatrcga gcggcatcgt ttttaaaaat 3040 
cattatgaat ttgaccctat atagatgttt ccaaataatt ctttttcacc ttcataaaat 3100 
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tccttcctgt 
tcctttacca 
cctcactgaa 
agaaat ccct 
tagcgttctt 
gctggcagga 
gtcagcctag 
gacctatcag 
tagacgatga 
gaaggcatct 
ggcttgagtg 
tggtttccag 
ttcctgaagg 
ctagaactgt 
gtctttggga 
ttgaactggc 
ctccaggggc 
taggctgtct 
cagtttgaac 
ctgtgtatta 
tcctttaggt 
cccagtattt 
agagttttgc 
ctccacctcc 
ggtgtgcgcc 
ttggtcaggc 
gtgctgggat 
acagcaattt 
ttgttctgtc 
tgagtgagtg 
ttgtgtcgcc 
cttcagttct 
agagcagtct 
agagagagta 
acctctaccg 
gacgtgggag 
tgccagaaga 
ctcgctcccc 
aaagcctcaa 
ccggctctca 
gtttgggctc 
cgtacaacgc 
tgagcgctgt 
ctgtctacag 
ctctcccgag 
gggaggtgct 
tgaaggacaa 
cagaacatgt 
aagccatgaa 
cgctgaagaa 
gccagctctc 
atgcttgtgt 
gagcccccgg 
ttgactttgg 
gggtttggac 
gaaaaacacc 
cttaagatat 
cttgagagca 



ggctgtgaga 
ttttagcttt 
agaccgatat 
ctcccccagc 
ctctgtgttt 
gataacattc 
agaatacatt 
atagcaagtg 
aggatatttg 
ccacacattg 
actgtcctcc 
gcaaggctga 
catcatttat 
cctcattgct 
ataagrgctt 
tcaggaagta 
cagcactgct 
gcacatcgcg 
agggctttat 
cttgaaatga 
aaaccatgaa 
ttccactcca 
tcttgttgcc 
cagattcaag 
accacgccca 
tggtctcgaa 
tacaggcaag 
tctatcataa 
tgtgctgcca 
gcccagagcc 
agctgttact 
ctctagccct 
aaagcaaccg 
cagcgtgaaa 
ttctaacatt 
ccccgaaatg 
ctttttgaaa 
cattccatcc 
gagctccagc 
agagcaccgg 
ctaccctggc 
tcactacccc 
gagcagcatg 
caatctcctc 
ctcgctgccc 
tgtcccggcg 
ggcctgtagc 
ggtgcagccc 
tctcattaaa 
gcagaacggc 
caatctgaag 
ttgtatttag 
ttggggatag 
acaagtgact 
tagaagatta 
attctgaaaa 
ttgcatcaac 
gagctaacac 



tgccttgcct 
aaaaaacaaa 
tggcctgata 
aagctt ccca 
attctggggc 
tctaaggggc 
taaagggttc 
tggagttctt 
cacaaaggct 
acagccaatg 
aataatcaga 
gcagggaatt 
tgtgtagcga 
gctgttccta 
tcctcttagc 
cctattgtgg 
gggatcctgg 
aggaaggtgg 
caaattcgta 
gtcttaatct 
catcagaaag 
ttaaaatgga 
cagtctggag 
cgattcttct 
gctaattttg 
cttccgacct 
agccactgca 
ggtctgtact 
ttgtccgcat 
ttctagaatg 
caggttttct 
ctgtgtaatc 
agcactgaga 
gaaatcctaa 
tcacccctca 
cccttctacc 
gcttccctgg 
tccaccactc 
cctcacagca 
gactcctacg 
tacgcacccc 
aagttcctct 
aatggcatca 
ggtgggggca 
tcagatggag 
ccccacagtg 
cccacaagcg 
aaagctacct 
aacaaaagaa 
aagatcaagt 
gtaggccttg 
cttgctttcc 
tgggtatgga 
tcccttctcc 
ggtgaaactc 
catgaagatt 
acttgagtct 
atgtggcttc 



atcagttttc 
agtgacaatt 
aggagatat" 
ccacggcccc 
ttcaggctcg 
tctcaaattg 
agttctggag 
tctcaactaa 
tcagcatgat 
ccttcagtgc 
gctcaaacta 
t ccagtt-tc 
ggagacaggg 
aatagtatct 
ctgttctgtt 
tttggcagag 
ctagaccaga 
tattcacztc 
ttcaacaaga 
ttcacattta 
actttta-ta 
agtttttttt 
tgcaatggca 
gcctcagcct 
tatttttagt 
caggtgatcc 
tccagcttag 
aatgaaaaca 
tttgctgagg 
agagtgcgtt 
caagaaggag 
gccccttttt 
aaaatgaact 
aattggactc 
catcagaaaa 
ctcgggtcgt 
cctacgggac 
caagcccctc 
gccctgggaa 
cttacttgaa 
tgccccacct 
tgccccccta 
acaactttgg 
gcctgcccca 
cccggaggtt 
ccttctcctt 
ggtctcccac 
cagcagcgat 
acatgaccgg 
acgaatgcaa 
agagagagca 
atggggtatc 
ttccgcctgg 
tgattttctt 
cctgctagcc 
tcttcttttt 
tggagcagaa 
ttcccaggtc 



aaccttact z 
agaacttcc- 
catt tcgm: - 
cccgtcagca 
cccaggagca 
gaatcgaatc 
tttcacagag 
attcaagcag 
cccccaaacc 
gttcctagcg 
aacatcgtac 
ccrgcccaca 
ctggctgtgg 
ttaccaagca 
ttcttgggtg 
gtgactgtca 
cagagccttg 
gctaagctcc 
gtagaagcga 
gtcctcaggg 
acctangaca 
ttctttttct 
caatctcggc 
cccaagtagc 
agagatgggg 
gcccacctcg 
gctatcttac 
gaatcaccca 
aggaaacgga 
ggaagccaga 
gagcaacttt 
ctttatttca 
ctgcccaaag 
caacccctcc 
ggacctcgat 
ttaccccatc 
cgagagaccc 
tgcaagaagc 
tacggtgtcc 
cgcgtcctac 
cccgccagct 
cggcatgaat 
cctcttcccg 
ccccatgctc 
gctccagccg 
taccggggcc 
ggcgggaaca 
ggcagccccc 
ctacaagacc 
cgtttgcgcc 
gtccaagggg 
gattgcattt 
cttttgccac 
ctgaataata 
tgtgattttt 
aagactgtct 
atgttaggtc 
cacctgagag 



gtcttzctca 
gcctgctggg 
cagtggctr.c 
tcttccctga 
actgataacc 
cctcaagcca 
ttcat;:ci:a 
agacatttr- 
tgctgcctc- 
caggtgr cc~ 
gtcttact zz 
tgggtg-tt- 
cagggaragz 
ataacgtgcc 
cgctaagtaa 
cgccttgtga 
gtgaagrgct 
ttggcatagg 
aaactgatga 
tatgctgact 
gggtccccac 
tttttgagac 
tcaccacaac 
tgggattaca 
tttctccatg 
gcctcccaaa 
tccagcctaa 
aggctgctgt 
actgcacttr 
tatgtggcga 
ggcagttttg 
gcacaaacac 
aatgtcccaa 
aaaggaaagg 
gactttagaa 
cgqqcccctc 
acgtacatca 
agccccgacc 
cctgtgggcc 
ggcacggaag 
ttcatcccct 
tgtaatggcc 
aggctgtgcc 
aaccccactt 
gagcatccca 
gccgccagca 
gccgccacgg 
agcagcgacg 
cttccctacc 
aagactttcg 
ctgtgagtgc 
gcagtagtat 
ttctagctct 
aaaaaattag 
gtgcttttaa 
tgatgctttt 
tcagagccag 
tgcacagtgg 



B160 

8220 

8230 

8340 

8400 

8460 

8520 

8530 

8640 

3700 

3760 

8820 

3880 

8940 

9000 

9060 
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agaacggcct ttcaaatgtc agacttgcaa 
gaaacactac ctggtacaca cggcagaaaa 
ctgggtagac cttctgacct ztg^agaaaa 
tagcccgtag ttaaagccaa caccagaccc 
atggtcctrc ccagtacttt gta^ctgctg 
tgggtgggaa aatggtaggg gaaataaaca 
ccgtttgctt aataccacac tggaggtgcc 
gggcgttggc cggtaagcct gcccctcccg 
tctcccrtcc ctgctgtctc "ctcccctac 
caccagcaat ctcaagaccc acctgcgact 
ggtgtgccct gccaagttca cccagtttgt 
ccgggagcgg ccccacaagt gctcccagtg 
caaggtzcac ctgaaaggga actgcgctgc 
tctgacccga atcaatgaag aaatcgagaa 
cgaggacgtg gaggatgaca tcagtgtgat 
ggtcagaaaa gagaaagaag aaactggcct 
tggactcctc ccctcagggt gcagccttta 
gcctcccagc aacccactac ctctggtacc 
aatggatcct taagattttc agaaaacact 
gtcagggtgc ctgtaggaag tggcttgtac 
agcaaatggt ttcccctcac ctctggaatt 
cagggcatga acaaggcaaa ggccatatat 
tatatactta tttacacctg tgtctatata 
ggacatgttt gcatagcctt cccattacta 
aatgataatc cttcataatt tattatacaa 
gtttacaatg actggaaaga ttccttgtaa 
ccattctttg tagataattt ctgcacatct 
tatatgactt cagtcaacct ctctctctaa 
gccaatgttg gacagttgat gtgttcattc 
cataacntgg gggtatgtgt gcaggattac 
aagggaatct tgtatatttt tgttgatagt 
ggaagggtga caggaaggct ttaccaacct 
caccgccctg ccctccccac cgagtcctgt 
atccattgta ttatcagaaa atgtgaagaa 
gaaaatttcc ccaaagcata ggtggctttg 
gtggtgtttt gttgttggtt tttgttgctt 
tgcacaaaca tggtgctcta ccaggaagga 
aaaaacaaac acacaaacaa caaaaaacgg 
taatgaacat tcctatcccc aacacatcaa 
ctcagtattt gtgtttttac attttatggt 
aagttgttca acaacagtta cctcattgag 
atctaatgat ttgcttctct agaggagaaa 
ttgtgttatt ctatctttta ttctgctaag 
tagcaaaaaa tgatgtatat ttataaatct 
tttataacca cttaaattgt gagccaagcc 
aaaaaaaaaa aaaaaaaaaa gaacactcct 
tcacaatcac gtcggtatga ttgggcaccc 
gtgcagtggt ggggaccaca aaacaaccag 
aaggaccatc taagacagct ctattttttt 
caagtcacag aaataaaaaa ctgactttac 
aaatactgat acattactcc aatctatttt 
actaatgttc acctgtagaa gagaacaaat 
tactggtctt ctgtaacttc caagactgac 
cagtccttaa "ctgaaggtaa accaaagcat 
tcccaactac tcgtttgttc tttttctcct 
aaagacttct tgcttctctc accatccatc 
ttgagcccac aatcaacagt ggttttattt 
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-aagggcttt actcagctcg zccaczzgca 1154C 
gccacatgaa tgccaggtgc gcagta"tt~ 11700 
- g~ ctigtgag rcaccccccc azqzczzaza I1V6C 
-gcgctgucc carcctggac tgategcac" 1132C 
a-gacttgag atggcacagc caqctzccao 11380 
gcccctcgtg cgccgtgtgc ccacazcczz 11940 
acaaggaggc ttcccacctc ctaggccgct 12000 
ttggcaactc ttaatcttct ggccttcctg 12060 
actgtaggtc tgecacaaga gatttagcag 12120 
ccattctgga gagaaaccat accaatgeaa 12180 
gcacctgaaa ctgcacaagc gtctgcacac 12240 
ccacaagaac uacatccatc tetgtagect .12300 
ggccccggcg cctgggctgc ccttggaaga 12360 
gtttgacatc agtgacaatg ctgaccggcc 12420 
ctctgtagtg gagaaggaaa ttctggccgt: 12480 
gaaagtgtct ttgcaaagaa acatgeggaa 12540 
tgagtca-ca gatctacccc tcatgaag" 12600 
tgtaaaggtc aaacaagaaa cagttgaacc 12660 
tattttgttt cttaagttat gacttggtga 12720 
ataatcccag etctgeaaag ctctcrcgac 12780 
aaagaaggaa ctccaaagtt actgaaatct 12840 
atatatatat atatatctgt ataca^atta 12900 
tttgcccccg tgtattttga atatttgtgt 12960 
agactattac ctagtcataa ttattttttc 13020 
tttatcattc agaaagcaat aattaaaaaa 13080 
tttgagtaca* aatgtatttt tgtcttgtgg 13140 
gtataagtac ctaagattta gttaaacaaa 13200 
taatggtttg aaaatgaggt ttgggtaatt 13260 
ctgggatcct atcatttgaa cagcartgta 13320 
ccaagaataa cttaagtaga agaaacaaga 13380 
tcatgttttt cccccagcca caattttacc 13440 
gtctctccct ccaaaagagc agaatcctcc 13500 
ggccattcag agcggccaca tgacttttgc 13560 
gaaaaaaatg ccatgtttta aaaccactgc 13620 
tgtgtgtgcg atttgggggc ttgagtctgg 13680 
tttttttttt ttttttttta atgtcaaaat 13740 
ttcgaggtag ataggctcag gccacacttt 13800 
gtattctagt catcttgggg taaaagcggg 13860 
ttgtattttt tctgtaaaac tcagatttrc 13920 
taatttaatg gaagatgaaa gggcattgea 13980 
tgtgtccagt agtgcaggaa atgaegtett 14040 
ccgagtaaat gtgctccagc aagatagact 14100 
cccaaagatt acatgttggt gttcaaagtg 14160 
atttatacca ctatatcata tgtatatata 14220 
atgtaaaaga tctacttttt ctaagggcaa 14280 
ttctgagact ttgettaata cttggtgacc 14340 
ttgcctactg taagagaccc taaaaccttg 14400 
ggaggaagag atacatcatt ttttagtatt 14460 
tttgecaett tatgattatg tggtcacacc 14520 
egctgeaatt tttctgtttt cctccttact 14580 
ataattatat ttgacatttt gttcacatca 14640 
ttcgaataat ccagggaaac ccaagagcct 14700 
agctttttat gtaccagtgt ttgataaaca 14760 
caegttgaca ttagaccaaa tacttttgat 14820 
tttgtgcttt cccatagtga gaatttttat 14380 
cttctctttt ctgcctctta catgtgaatg 14940 
tttcctctac tcaaagttaa aactgaccaa 15000 
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<210> 66 
<211> 46340 
<212> ADN 

<213> Homo sapiens 
<400> 66 

tattttactt cagtaacaga aaatgaaaga aatgttt taa tgttgctgat tgtattacct 60 
tcaggatcaa tagcagaagg acaaacttct ttgaggagat cccctagtgt gtgcaactgt 120 
ccatctgcag ccacaggacg aaacagcttc tgaatgaaag gtctttcagt cgttgtctat 190 
ttgaaaaagg aaaaaatgat tcaagcaatt aagtctttgt tgctgccaat tacaaattta 240 
tatatcataa actttatgtt ggcattaggt gccttttgat acggtgttag cacaactaca 300 
caacatcaca gatgtggtat cactgtgaaa aatgtttaac acgataaatt caggtaaatc 36C 
taattctgag gaaacagaca aatccaaagt tgggtgggac attctaaaga taattggc-g 420 
ggacccttca aaaacttaaa gacattaaaa agcaaacaac acaaaaagat atcaacaaaa 480 
gcattttttc tcagtatctc ttaaagagac taacaaagca aatacaaaac ataaaccatg 540 
gctgaatact aaattgaaga aggacatttn ttagaaatcc aactatgaaa cacagttttg 500 
ggataaatgg ggaaatacag aatggacaac tgataatatt actgagttaa tgtcaaattt 660 
cttaggtaca ataaggacaa tccttatttt taagaaattc attgttcaag tgtttaggaa 720 
agaagtgcca tgatatccaa aacttaatct tctttctctt tttttggaga cagagtctcc 780 
ctctgccacc ccggccggag tgcagtggcg cgacctcagc -cactgcaac ctctactttc 34 0 
caggttcaag tgattctcat ggctcagcct cccaagtagc tgggactaca ggagtgcgcc 900 
accatgtcca gctaactttt tgtattttta ctagagatgg ggcctcacca tgttgcccag 960 
gctggtctca aactcctgag ctcaggcaat ctgccggctt cggcctccca gagtgttagc 1020 
gttacaggcg tgagccaacc gctcctggcc ccaaaactta accatctaat ggttgagaga 1080 
gagacagaga gagagagaaa gagagagaca gagaatgtgt gtgtgtgtga agacaaagca 1140 
aaaataaaaa aatattaact aatggtgatt ctaggtagag ggtgtatgat tttagtagtr 1200 
tcattatttc aacttttcga taggtttcac aattcccaaa acagcagatc cagccatttc 1260 
atctgacaaa aactgttagc agcactacat cgtaatttat tgctaataat ctcattgt tt 1320 
tactcttaaa attgtttcat ttactaaatt tccctagtga tgatggaggc tttatcatga 1330 
cagagtacag aggctctgaa atgagccagt gtctatgaag agcaccactg tttgcaagar 14 40 
ctatgatctt gtacccagtt tcctttatct gttaatttgg gacattccat atctcttgag 1500 
tttgttgtgg aaataaatga gcaactttgc caaccacaga gtaaataaat aaatgttaaa 1560 
gagaataaaa gcatttttac ctcctctctc cctcttaacg gttatttcac tttaagacgg 1620 
taaattttaa gctttctgag atgaaaaatc attaaaactt aacaagaaca gagaaatgcc 1680 
atacatacat attttttgtt tgcttgtttc ctgagacaag grttcactct gtcacccagg 1740 
ttgaattgca gtggtgcaac ccccaagttg caatcctcca cctaagcctc cagagtagct 1300 
gggactacag gtgtgagcca ccatgctcag ctaatttttt tacttctttg tagaaggggg 1860 
tctcactatg ttgcccaggc tgcctcatat tttataagaa tatgacttca aacacttagg 1920 
cattagcgac aaggttttgt ttttgtcttt taatgacaga ggtatacctc aacatatttg 1980 
acacaactgt tagagatttg gtttaaaaag aaatagacat ggatgaagct ggaaactatc 2040 
attctcagca aactaacaca ggaacagaaa accaaacacc tcatgttctc actcacaact 2100 
gggagctgaa caacgagaac acatggacac aggcagggga acatcacaca ccaaggcctg 2160 
tcggggagta gggggctagg ggagggatag cattaggaga aatacctaac gtagatgagg 2220 
ggctgatggg tgcagcaaac caccatggca catgcatatc tatgtaacaa acctgcacat 2280 
tctgcacatg tattccagaa cttaaagtat aatacaaaat gaaaaaataa ataaaaataa 2340 
gtagaaaaaa taaacatgta agcatgtgag ctgcctttcc taattctatg tttatgtatt 2400 
cactgaatac atagtatttt aaaatagtaa tccaataata tatttgagtg tttgtgacaa 2460 
gtatgaaaat tgtaattttt aaaaaatctt gataatatgc attgaatatg atttaattca 2520 
cttcactatt tgaactcttt agggattatt tttaaaaata tgattgatat cctttgacat 2580 
gttttggctc tgtgtttcca tccaaatctc atctcaaatt gcaatcccca cccgtctagg 2640 
gagggactgt aatccccatg tgtcgaggga gggaggtgat tgggtcatag gggtggtttt 2700 
cctcatgttg ttctcgtgat actgagtgaa ttctcatgag atctgatggt tttaaaagtg 2760 
gcagtttttc ctgcactctc atctctcttt cctgctggct tgtgaaggtg cctgcttccc 2820 
tttctgccat gattttaagt ttcctgaggc ccccacaagc catacggaac tgtgagtcaa 2880 
ttaaaccttt tgcctttata aattatccag tctcagatat ttctttaaag cagagtgaaa 2940 
acagactaat acattcttca atttaaaaag ccatactttc ccatacaagt tgaaaccaag 3000 
aacaatatca tgcataatca agtgattaac tgtgtaaaga taataaggtt gaggagttca 3060 
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gagaagaaaa gaaatgaata gggaactgta gtgataattt aaaatagcca tccctcactc 3120 
agggtttttg atcttcaggc catgaagaag ctttcaatcc tttttagcaa aggaagtaar 3130 
gttggtgaaa ggctttttct gacgactaat ggaaagcagc gcnacgta"? gtgacttgg - : 3240 
tatgaaccaa aaccagaatg actggtgaga ggctgactga auacagcaag cttatgtgaa 3300 
gacaactgga gctggtgcag tggaaaagga agacagcagg actgtaccca caactcaaag 3360 
aaaaaagtca gaaggtacct cccgcagtcc aacctgaaaa caacaaagtc aaaggaatc- 3420 
tttcaagaat ttggagctct cattcatatc ccaattagtg catgaaatgc gaggtggctt 3480 
tgctataatg aaattacctg gaatatttct aacacaaaga aataataaat gcttgaggtg 3540 
gtgaatatcc tcatttgatc attacacatt gcatgcttac agcaaaaga- tacatgtacc 3600 
ccataaataa ttgcaactat tatgtatcca taataattaa aactaaaaga ttaaaaatta 3660 
cctgaaaaaa aatgctaaac aggaaagccc aactagtctt ggttacatar taaaaaacag 3720 
aaattcttct ctaacctcac tattggagaa atatcctgtt atttttata- atctcttttt 3780 
tcaccctttc ccaaatctga gcaagtatta taaaggtata accttcaaca atcttttacg 3840 
atgaggtatt tgcttactgg ggacaaagcc ccagtgctat tacatagtgt agctaaacgc 3900 
tgtagaatgg taaaaacaag aaaatgctca gcaaagtgtt gtttctca" taatgaaaat 3960 
cttattttaa aacacaaaaa ctcaatatac cccaaccaaa aatctgatga acattttctg 4020 
tttaatattt attatacagt acctttaaaa acgtaatatt cttattctra aaaatttagt 4080 
gtgctagcaa atagcaatta agtacctaag tcaatcagga cgacaaaaaa atactcaatt 4140 
tggggagtta gttacttcta tcatctgaat gcgtccctcc aaaattcatg ctgaaaccta 4200 
ttcctcatca tggcagtatt aagaggtgaa gcctttgaga ggtaattagg tcatgagggc 4260 
agagtcctca agaatgggat caatgctctt ataaaagagg ccccagggag cttgtaaggc 4320 
ttttgcccct tctgccatgt tgggggggtg ggggtggggg cgcagcaacc agtgctaact 4380 
ctgaagcaga gagcagccct caccagaaac cgaatctgtt gaagccttga tctctgactr 4440 
cccagcctcc agaactgtga gaaataattt tctgttgttt ataaattacc cagtccaggc 4500 
tgggcgtggt ggatcacctg aggtcaggag ttcaagacca gcctggccaa tatggtgaaa 4 560 
ccccatctct actaaaaata cagaaaatta gctgggcata gttgtgggcg cctgtaatcc 4620 
cagctactca ggaggctgag gcaggagaat cacttgaacc cagaaggcag aggttgcagt 4 680 
gaatcaagat catgccattg aactccagcc tgggcaacaa gagggaaact gtctcaaaaa 4740 
aaaaaaaaaa aagtacacac tctaacatat tttggtatag cagcccaaat ggaatggact 4800 
aagacaatta cccttaaaat aaaagctccc atagagagat catgcattca agtacagagg 4860 
ttcttaaggg caatgggaat ggaggacata ttcctgcaaa cttttcaaca gctctcatta 4920 
gcccgatgtt agagctctgc aaagaagact aaattatact gagaaatatt tttaaatctc 4980 
cacaaatagg aatgctgtaa acgttgattt agtatatata aaattagaca agactaacaa 5040 
tatccaatgc aatctaaatc ttaggttgac agacaagaaa gccaccgcaa acaggaatac 5100 
accacaatac ctgatcttgc cacatatttg taaatatgca aagtatttca ataacttcca 5160 
agaaacagta ttactctcat gagaaataac atgatgraag tcacctttga aactgtcct^ 5220 
gttacttttt caaatgtatg ttagtcattt cttaacacca aatgaaatga aaaactgagg 5280 
tggtaatggc tggctgctcc catctctcct ctactcatg- gccttcacca atacagcaat 5340 
cattttttct tatatgggaa atttacagtg ttgatatagc tcagagatat attgaagaaa 5400 
agcagaaaaa cgaaacttat aaacatttta ggaaacctta tgtattttct taaatagttc 5460 
aagtgtaaaa cttagaattc ctataaataa tgtgtgttac agctatattg taaatggtgg 5520 
ctcatgcctg taatcccagc acttcaggag accgaggtgg gaggagagct tgagcccatg 5580 
agtttgagac tcacccgggc aacacagaga gacctcatct cttaaaaaaa aaagaaagaa 5640 
agaaagaaat gaaatgcaaa gaaaaagtct ctatttcaaa tgtagccagt agagccaata 5700 
ggttaaccaa tattaacatt aacgttgata aaacaagaaa tgatgattta ctataagctg 57 60 
aaaatcagac aatgtatgga ctttaagagt aacaggcacg atcatcacaa acttaaatca 5820 
ggtttgagtc ctatgagtta tatacagtta catgatgcaa caaaagatgc cagccagttg 5880 
ttaaagagta ttagattcgg ctgggggtgg tggctcatgc ctgtaattcc agcactttgg 5940 
gaggccgagg agggaggatc acgaggtcgg gagtccgaga ccagcctggc caatatagtg 6000 
aaacctgatc tctactaaaa atacaaaaac tagtcaggca tggtggcacg tgcctgtaat 6060 
cccagctact cgggaggctg aggcaggaga attgcttgaa cccagggggc ggaggttgca 6120 
gtgagccgaa atcgcgccac tgcactctag cctgggcaac agagcaagac tctgtctcaa 6180 
aaaagagtat tagattcaag tcctgtttct gtcatttatt atggaaccat ggacacaact 6240 
acctatcttt cctgaacctc agttttttca actgcaaaac aggaatatat acatatgtgt 6300 
atatatacat ctgtgtaaac acatatgtgt atatatacat ctgtgtaaac acatatgtat 6360 
atgtataaat ggagataata cctacattat agtttctgag ataataaaac gcacaacaca 6420 
attctgacac ataacaattt gtaacttaaa acataccatc accagggcca ctagttttag 6480 
aacactgtaa tgcatagtct aatttaatac tatgcaaact gtgttcactc aaggttttat 6540 
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ttcctttcaa 
tgaaat tcag 
aagtcatttt 
taaaagggaa 
cttttgttct 
aatatttgca 
aaattcaaca 
acagacattt 
cacatcatta 
taccaaaata 
aatagtcctt 
tatggcagtt 
tgaatattcc 
tgttttattc 
gaatgcttat 
ggaacaaact 
aaaaaagtca 
atgacaaaaa 
gcagtaaggt 
gggtatattt 
acacacacac 
tacaatctcc 
ctagatgaag 
attatctcaa 
atcaaagttt 
tagattctca 
caagtgattc 
caacctactc 
ttggacagtg 
caggaaaagc 
agaacagtca 
ggcagataat 
gaaccaaaat 
aatgaatgta 
cttttactct 
tcaaataatt 
cacatattct 
cagctctgtc 
ttgtgtgtca 
tttttgtgaa 
gaattctcaa 
ctactgaatt 
catatactat 
tttggtcata 
aatgaccatt 
ataaagagga 
ataaaaagct 
ccagtagatg 
cacggatgga 
aaggggctca 
taatcccagc 
gcctggccaa 
gtggcgtgca 
tgggaggcaa 
agtgagactg 
atttgctcca 
atattatatt 
catcagctac 



tttcattcat 
aagtttacgt 
aacacnact t 
tactaataaa 
gcaaaagatc 
aaccatattt 
gtttttaaaa 
taccaaagag 
gccattaaag 
tccaaaataa 
cacacactga 
tcttacaaaa 
cagaagtaaa 
gtgagagtca 
aaactgactg 
actggtatat 
atctcaaaag 
ttttagaaat 
aggtggctgt 
tgaatatagg 
agtatatgta 
tggttgtgat 
ggtatgtaga 
aataaaaatt 
tctctgagga 
ggctgcatat 
atgtttaaag 
taacacactt 
actctcaaca 
cccttaggtg 
attaaggctc 
atatactata 
cagaattaaa 
gtctaagtaa 
tcatacttcc 
tatggcctgg 
agctctggat 
aattagtacc 
attgtatcat 
ggttatacaa 
tgagtgttat 
ctaatatgta 
tcttgtagtc 
catattgttt 
tatggctaga 
ggaagaatgc 
atgaaagaga 
cacaatgcac 
ggtgctgggg 
agtttattta 
actttgggag 
catggcgaaa 
tctgtagtcc 
aggttgcagt 
ctcaggatct 
gtgaggctta 
gataatttat 
tttgtgtgtg 



ttactcc tea 
tttaatgttt 
tcaaaatcag 
tagacttaat 
ctgtgaagag 
ccgagaaagg 
aaagcaaata 
aatatatagg 
aaacgcaaat 
aaattagtgg 
tggtacaaat 
etaaacatge 
aatgtcttct 
aaaacagaaa 
taataggtct 
gcaacaactt 
gctacacact 
ggaaaacaaa 
ggctataaaa 
gtgaatttac 
aaactaagga 
actgtactgt 
tctttctgta 
tttttcaaaa 
cctgtagcat 
tggaattcct 
tttgagaagc 
gaaggecata 
caaatgagtg 
atcctgatga 
aaaacaaaag 
acagagcaaa 
atcactaagc 
atactaataa 
tagtcacaaa 
tacagtaata 
ggcacttgat 
tatatgaccc 
ctataaaatg 
ttaattcata 
aattgttctt 
ttctgtattg 
aaccctgtta 
tacatacatt 
agggtatata 
catcagagta 
aaaacataaa 
tgggttgtaa 
gagtctccta 
aaaagagatt 
getgaggegg 
cctcatctct 
cagctactca 
gagctgagat 
cccaaagacc 
gatggacatt 
gtatgttgta 
tgctttgttt 



g- tgtttgta 
ttctacatgg 
cccagaact t 
taaaattaaa 
aatgaaaaca 
tcttgtgtct 
acccaattag 
tggcaaataa 
taaaaccaca 
taacaccaaa 
gcaaaacagt 
act taccata 
ccaaaaaact 
gcaatcccag 
gtcccacgga 
ggatagatct 
gcatgactcc 
ttagtagttg 
gggtagecta 
atatgtgata 
aatctgagta 
aattatgcaa 
ttatttctta 
tttcaaaaca 
tttggttatc 
gaattggaat 
actagtctac 
acaaaattca 
aggaaaggtg 
aatgttttct 
taatgtttat 
ggtaattatt 
acataatgaa 
tggcagttat 
catctatttc 
agagcatgat 
gacgatggat 
tagtcaaata 
aggatattaa 
taaagtattt 
tttaaatgtg 
agctgtcaaa 
ctatgttatt 
aagaattatt 
tctggctcac 
aaaggagatt 
ataaccaaag 
aacttaaaat 
cggacacagc 
ggacaggccg 
gtggatcatg 
actaaaaata 
ggaggctgag 
catgtcactg 
caaatccctg 
ctagtcttct 
tttttcaagg 
ttaagtcttt 



agct aaaaaq 
caaggaaaaa 
aacactaaag 
caacaacaac 
taagccgcag 
ataatatata 
aaaatgggca 
gcatatgaaa 
atgtgatatc 
tgctggtgcg 
acagtccctc 
tgaccaagta 
tatacatgaa 
ggctacccat 
atactactca 
caagggagtt 
actgatataa 
tcagaggtta 
agagatcctt 
aagattgeat 
aggtttgtgg 
gatgttagaa 
caattgeatg 
actagtctag 
acctggatct 
ccgcattcta 
aacaatgact 
catcaacaac 
gggactcaag 
ccatcctggc 
aatactggag 
acaatgtata 
aatcctttaa 
agtgagaaaa 
caaaactgac 
atttaaagee 
tcagcttatg 
cttaaacctt 
cagtatatac 
agaacaatgt 
acttgactct 
aaaaataagg 
actagtgtca 
agaaatgttg 
tgactgtgga 
ctattcactg 
gggtgaaact 
ggecttaatt 
aggcagaatg 
ggcgtggtgg 
aggtegggag 
aaaaaaatta 
gcaggagaat 
cactccagcc 
caaactgaat 
tggttgagct 
tatagcaaca 
tgaaacagga 



tccagaa t ca 

aaaaagggca 

gcatc- cc 

aacagczaag 

gctgggagaa 

agaactccca 

aaagacatga 

acatatctca 

at tacacacc 

catgtggaaa 

aggaaaggag 

attatac-cz 

cgttcatagc 

taaaacagc" 

gcaataaaaa 

atgttatgtg 

cattagtgas 

gggaagaaat 

ctgttgaaac 

agaactaaat 

attatattaa 

ttgggggaaa 

tgaatctgta 

agcrttgtta 

tattaaaatg 

acaagarttc 

tttaaccttt 

agttgctcgg 

actcaggtag 

tgaaaaaccc 

atctttaaaa 

aatcttataa 

aaagtataaa 

gctctagagt 

ecttegtatt 

agtcagaaga 

gttccaatcc 

cttgtgttac 

ctcatagatt 

ctagcacagt 

caacagaact 

attataataa 

gttttgttgr 

gtttattaaa 

gtcaatgtcc 

aaacaaagtg 

taacagatgc 

aaaagccaag 

taacaatgac 

ctcacgcctg 

ttcgaggeca 

geegggagtg 

cacttgaacc 

tgggcaacag 

gcataatatc 

gaagaaacaa 

agtttttatt 

tggtgattta 



6 600 
6c60 
6 "20 
6"30 
6340 
6300 
6?60 
7020 
7030 
7140 
7200 
7260 
7320 
7330 
7440 
7500 
7560 
7620 
7630 
7740 
"SCO 
7360 
7920 
7980 
8040 
3100 
8160 
8220 
3230 
8340 
8400 
8460 
8520 
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8640 
8^00 
8760 
8820 
8880 
8940 
9000 
9060 
9120 
9180 
9240 
9300 
9360 
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9600 
9660 
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9840 
9900 
9960 
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ctacatttat aagtaaaact -att-ga.tt acaagggttg cttaagtgta tcacagga:t 10O8G 

tcacttgtta tatttgcagg tgcttaaaaa atcagctata ctaaactata actggaatta 10140 

gcaaagttca tttattgatt aatcaagaat ataattagat ttgcctaact ataraagtag 1020C 

tactacgrgt tatttaagaa ttaaatccag aaaagggatg gactctggaa ana.caagaa 1026C 

gtgaaaaaga ctgctctcat ttttgtacaa caattactaa atttctaagt agcattaatt 10320 

gaactgaaaa ggcattttag aaaaactaga trttacaart tataactcca ataaaacaca 10360 

actaactatg agtgtgcttg ttcatgccca aaagctacct tccaaaatta aaaaccctat 10440 

tggatggctg ggtgcagagg ctcatgcctg taattccagc actttgggag gccaaggcgg 10500 

gcggatcacc tgaggtcagg agttcgagat cagcctggcc aatatggtga acccgtctcz 10560 

aacaaaaata caaaaattag ccgggcgctg tggcgggtgc ttgtaatccc agctacccgg 10620 

gaggctgagg caggagaatc acttgatcct gtgaggcgga ggttgcagtg agctgacacc 10680 

gtcccactgc actccagcct gggcgagagc ccagagcgag actccgtata ttaaacaaaa 10740 

caaaacaaaa ctcaaaaaac cctattggca attactaggg ccatcaaatc agtatacttt 10800 

cacttgacac acaattttga gataatgaac cgaacttacc atttttgaaa atacracata 10860 

ataaatatta gtgaagcttc attgctgaaa tggtgacaaa gatgaatagc aataaaactt 10920 

ttcttataga tctttagcaa aaacaaaaaa accccaagca tactatggta cattactcta 10980 

gagaatcaag tagctgctag ttgagtaata gtggtaatag gcactacaac gacaraaaca 11040 

aattacaaca aagaatattg tttttatttc ctgtccacgt tttaaaaaag ctctggtttt 11100 

acctatgttt aacaaaagca taggtacaac aacgactact actactaaca tataagtagc 11160 

ctggatagaa ttatcttaat agtagtaccc aagtgcagga tctctaagta atgatcagaa 11220 

ggcaggaata aattttatca gaaatcttca tccattacat atttactatg caettaccag 11280 

ggtatcacta tgctaatgga tacaaagaca aataacatgc aaacaactgt aaracagtgt 11340 

tatgtgataa cagaaatatg tacaaagcac tatgaaaaaa attacaaagc ttgagcacaa 11400 

attttaactc tggacttact ggcatttaga gcaaaaccaa aacaatccta actggtcaat 11460 

ttcattttct aagagttgga agctatatca gtaggtacaa agtaaaatat gctaattgtg 11520 

gtagaaagta aaatattaca acagtagaga atttcaaaag aagataaaaa taatggaggg 11580 

aatatagaag gtcttcaagc ttccagcttg aaacacatat ttttttttaa atagagaaag 11640 

agataaagtc atttgagtat tcagagggca gactgaatat aatggtactt ctgagaaatc 11700 

agtggataag gagagaaaag tggactaaag gccatagcat atagagcttg gaatgtcaaa 11760 

tgtagtggaa ataacaaagg tttggttgga atcccaactc ccaacaacgt actgtgtatc 11820 

tagagcaaat tacatcaacc tttgggagta ctgtttctga atctgaaaaa tgaggaaaac 11880 

ttatctttga acaattgatg tgataattaa atgagatata tgaaatatct aatgtaacaa 11940 

gtgcttaaca atgactagtt cttttcattc ctctcttgaa ccattgtgaa acgtagaacc 12000 

aagaaaggta acagtattta gttgttacag aacccattaa gagagaataa aaaataactg 12060 

gtattctaac ttcagtttcc tttgaagtct tgttaatgag aataaatatt atgtggcaca 12120 

aagaaaaaga aaacaggggt ttacacagga tatgctgcca gactttacca acaatgacac 12180 

atgatatctg cttcaactgt cccatgcata tttggcttaa gatatattca tgcatatcaa 12240 

attttacatc acatggtttt caaaagaaga ttcattaaaa tnagcttaag aargtacaca 12300 

atatacaata cctcattaaa taaaaagaac agaccattcc caaatgaatg cttttagagc 12360 

tttacagtaa acagtctttt ggtggtagaa agagggggaa cagagagggg agtgggtggg 12420 

agtctgtagc acttatcaga ctacttttat cctttatgta gagaaatagg agagttgaaa 12480 

ataagcactt tctgtactta tgttgagagt ctgaagccca cttttaatag tcttgacaac 12540 

actaaaaaat aataattaac atttgaaaag ctgtcattat tatagtcagg gacacttaat 12600 

ctccaaagga gaagtttctt aattgatact atgattaaat aaaagcatcc atcagaatta 12660 

tatccacaat ctggtttgga gtttatgttt tgtcttattt aaattgttat acttattata 12720 

attctgtcta gacagtgcca aatgtacttt gtcatacaaa cacttgaggc aaattttctt 12780 

caaataagcg caacactttg tttcctcttc gtatcctttg actgaataac gtgtggtaca 12840 

gagaagtaat acttcccttt cttgggatcg agatcaattt gatgcttgtt ataagcccat 12900 

ttacagaaca aatggtattg cttttaaatt tttatatgaa cttatcagta gactagccaa 12960 

aaaagaagct tcatataaaa gtgctaggat tgatattctt agtaataatt aggtaaattc 13020 

tctaaaattt tctcccaaaa gatctgaaaa atcataccaa gggaagtata gtttaaattt 13080 

cattatatat aatagcttta aaatatcttt gctaattcta cccaaagcca cactaaaaag 13140 

actaatacaa aaagaatgta attaataaac tattttcctc tgaagaatca aagggcactt 13200 

ctgcatatga acatgtttta tccttttggt gtacttacat aaaataatta agaaacactt 13260 

ttaattagta taaacaaaga aatcaaaata gcaagaagaa atgtctgagt aaaagcagct 13320 

gtgctgacct caaaagtgaa attctgttct cttgatgccc agttaagtgt ctaacccagg 13380 

gaaaagtgat tctaaacctg ggctaggagc tagtggagct cttcaaacag tctcacctac 13440 

cctcacccct caaggaatgg tctatgggtt ctgrggtgaa cgctaaagtt tataacatgg 13500 
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gaatatttat tattttgttt ctaacacaaa taatctttaa aaattia::: tactaaagta 13560 

acatcaaagg gaaatttcat aaaaattctt ttgaaatttt tagaagtagc aaataaagg: I362G 

aagtgataaa tattttacag atttcaccac ttacgtaatc tgatcaacaa attttaaaaa 1368G 

catagcactt gaatactatt aaaaatatat taaaaaggta acatagcaaa actataaaat 1 37 4 C 

tctttaaaaa aaatataaga ggaaaccttc gtgaccttgg attaggaaat ggtttcttac 13800 

atacggcaac ctaaaaatac aagcaaccaa agaaaaaaac agacaaactg gacttcatca 1386C 

aagttaaaaa cttttgttct tcaaatgaca tcatcaagaa aataaatccc acagaatggg 1392C 

acaaaatatt tgcaaaccat atctgataag agaccactat tcagaatatg taaagaattt 13980 

gtaaaactta taaataaaaa gttaaagaag tcaattttaa aatgagcaaa ggatctgaag 1 4 0 4 C 

acaattctcc taagaaatac gaatggctag ttaaatgcat gaaaagatgt ttagcatca; 14 IOC 

tggtcat tag gaaagagcaa aaaccaaaat gatatactcc treat accca ct aagactg z 14 16C 

tgtaattaaa actatagaaa ataagcgttg gcaaggatgt ggacaaat-g gaaccctcct 1422C 

catacactga tggtagaaat gtaaaatggt geagatgett tggaaaacag tctgacaata 14280 

ccccaaaggt ttaaacgtgg aattaccatg caacccagca attctactcc taagtatcta 14340 

cccaagagaa atgaaaatat atgttcacca aaacatttgt acataaatat taactgeage 14400 

ttttattcat aatagccaaa aagtggagac aatccacatg tctatcaatt ggtgaattga 14460 

taaacaaaat gtggtatctt catacaacta ttactgggcc ataaaaagaa tgatgtatcr 14520 

atacatgeta caaaatgaat gaaccttaaa aacaatatgc aagcaaaaga aaccagacac 14560 

aaaaggecat atattacatg atgetaatta cataaaatgt ccagaaggga gaaataaatt 14640 

agtagttgcc aagggctgga gggaggggga atgatataag tgactgccaa tgggcatgcg 14700 

gtttcttttt agggtgatga aaatgttctg aaattttatc aegggaaegg ttgeacaact 14760 

ctgtgtaact tagaattcag tgactcctaa aaccaatgaa tagcatgc" taaaaggtca 14820 

ectttgetga gcatagtggc tatagtccta gctacttggg aagctgaggc aagaggatca 14880 

ettgagecag gagttccagg ctgtactgca ctatgatcat acctgtaaa- agccaccata 14940 

cacaccagcc tgggcaacac agaccatgtc tctaaataaa taaacaaata aataaataaa 15000 

agggtgacct ctgtagtatt gagattatac ttcaagtaag ctgttattaa aaaaaaaaaa 15060 

gttatcatat gggtggcagg ggaaatcatt ctgggatgat ggctaacttc atcagtattt 15120 

gatttatacc tatgeatcat accttatgtt tgttttatgc attttgtggg ttttttaaaa 15180 

aaattatatt tcataaaaac aaattttaaa aaaattaaag tcaagaaccc caaaacaaca 15240 

aagatcagag atacatttct accttatcaa ttcagaaaaa ttacaagttt ttttcttaaa 15300 

aattgtatag catcatggtg attttaagtt acctgtagga atttaaataa ctttgtctta 15360 

actgttcacc aaaactcatt taatattcat gttctgatac tgaaaargaa gctgaaaagt 15420 

tttgaaatta caatatgeta gtttaaaaag gtttactaaa atacataatt tcattataac 15480 

gagtaatatg aaataaaagt atcaaatatg ggaccattaa aaatgtcctt actaacaaa" 15540 

tgctacccac attgtggact cactgcgtcc actgtttgcg agcttttcca gaacgctcgc 15600 

caccagttag ggtagccaag aactcctcat cttcactttc ctcctcacta gcttggaacc: 15660 

tctggattcc cacccacact gctgtgacct gaatggggaa gagaaacgee atagtaaggc 15720 

aactcttcct tttatagatt tctgaattag aatctggcat tacaaaagaa caatgttata 15780 

aatccaggtc agagtttata gttctatttc actattactt atatggcttg tcctaggaac 15840 

ttaactatta tttacaatgt aagtacctat ttccacaaaa aaattcaaaa ttttggaata 15900 

caatatctga agagagaatg gtctattgaa tccaaagtag gctgatacat cccaacagta 15960 

tttcagattg agataataat aataccacca attcatcaag tcaaattata tgcttatttt 16020 

ccacaatgga agttttaaaa tagtataaac attttaatat atagcaggct taacttatga 16080 

ttattaaaca gggttctaag aaaatagtat acatcaaata ttaatgtgct tcttgtataa 16140 

tttaggtgac aatttatcca tctgagaaat gcaaaagaga ctttggtaag gggttgagta 16200 

aggagcattc tgtgtcaaag aattcactag caaaagaggg tatactgtag ttacaagcta 16260 

taatcactgt acttatttta aatccctctt cagaaccagg tcttaaaaga tgataaacat 1632C 

ggcctcatga ataactatca accaaactat agaaaagagt gcaagagtgt ggtgttctaa 16380 

cttaaaatat ggtgttttat tcaaataatt ttatttaagg ctccaaaagc agcagcctca 16440 

ttccccagaa atcatagtta aatgaaatct tccttactaa aggaaaaatg aatcacaata 16500 

tttaacgtga acattttaaa aacactctaa agcaacaaaa ctattcaatt gtatgtgata 16560 

tggcttagaa aggcatgtag gtaaaaagga ctaaaaactc taataatget tgggccaaaa 16620 

gtaaatttgt tagttctact ccattaagca ttcctcaagc agtgtaaaaa tcagagttca 16680 

agttacactt tgatgtgtag atcctttgaa agccactcta ccctgtttta tatgaagcat 16740 

ccgcagctaa aatgaacacc tagtgaagag tatgaatget gcaatacata ageagaegtc 16800 

agaattgtcc caagctgatt ctaagttact ttaaacatgt atgcagagtc agaatatgac 16860 

ttacttctta gaagtaacag ataattacct ttggcataat gaaaaaaact ttaaatgtaa 16920 

gttaatacag gtattttccc tttagcaaag etttgetttt aaaagaaaac ttcaaaactt 16980 
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aaat" aaaat 
agaaaaggaa 
agaaggaaag 
tattattcct 
taatctacgt 
tacattggat 
ttctatattt 
tggttaaatg 
tgcacattaa 
tctgcagatt 
ttttctrgtt 
tatgaaatat 
tatatgcaaa 
ccagggaggt 
tcagtgaatt 
ttgtgtcaca 
gacatatggt 
caaactcacc 
ataacagtgg 
aagctaacca 
aagatatcaa 
gaattacatt 
aggagtttca 
tgcacacaac 
atctgcatgc 
ataaaaccaa 
tgatatcctg 
ggacattagt 
ctatatatta 
accaaaagca 
gtaattctgt 
atgagaagaa 
taagcagatt 
tcattctgga 
acataaagaa 
ctaagctgaa 
agcccatgtc 
gttctaacta 
tccaagaaat 
cagtagactt 
gatataaata 
tttaagccat 
ggtggctaac 
ccaggaattc 
aaat'tagctg 
gagaatcacc 
ccaccctggg 
aaaaaaatca 
ccaaagacat 
aagtcagtaa 
attattattt 
caatcatggc 
cctgagtagc 
tagagacagg 
aagtgctagg 
agaatttatt 
atcattcaca 
catatactac 



aggaaatgct 
ggattctatg 
aaaagagaaa 
ttcaaatttt 
tcctcttatc 
ttccgggtct 
catgtcattt 
aagttcaaaa 
ctcagccaca 
caactaacca 
atcatcccct 
tataagtaar 
tactacacca 
cctggaacta 
caggattcac 
acatatacat 
ctactcaaat 
attccattga 
ttctctgaac 
ttgagaagta 
agtcagatga 
ttaatatacc 
agtatgcata 
aatacgtaac 
actgcaaagc 
aaaacaggca 
atatgaaatg 
ctttgtattt 
cctacttaaa 
actctcatat 
tcttaacaga 
cagaaaaaaa 
ttcttacacc 
tgccgacatt 
accaatatcc 
gtttgcaact 
aaccaatgaa 
ttctaaggta 
tctaacatca 
acattttgta 
ctatcaaata 
ctcacattta 
acctgtagtc 
gagaccaacc 
cgcctggtgg 
agggcctggg 
tgacagagtg 
aaactgatca 
cttaaggaga 
ggtcaatttt 
ttttttgaga 
ttactgcaat 
tgggattaca 
gtttcaccac 
attacatgcg 
tgtggagaga 
atctatcttt 
atgcatgagc 



ctacta tgta 
agggaggaaa 
aggaggaaag 
aaacgagcag 
tatgctcgga 
tcagctctga 
ctatttgcaa 
ataagtataa 
catccaacac 
tgggccgaaa 
aactacagta 
cracagacaa 
ttttatatca 
atcacccaga 
attatttcac 
gcagacaggt 
acggtttcca 
caagcgacct 
caatattgac 
catactgt ~g 
tacaactgaa 
ataagcaatc 
tgtcaatatc 
tgtacttata 
aaaagtataa 
tcacacacaa 
tcaaacaaaa 
ttaaattgat 
attattagca 
ttacccaaaa 
caggtgttgt 
aattagaagg 
atgaaattgt 
ctctatgatg 
aatagtaaag 
accaagaatg 
aaatgggagg 
taggctacct 
actgtaatct 
atattttctt 
attagctata 
acctaaactt 
ccagcacttt 
tgggcaacat 
tgtgcgcctg 
agatcaaagc 
agaccctgtc 
cttgaggtcc 
gatgaaatca 
tacatatatt 
cagagtcttg 
gtctgccttc 
ggtgtgcgtc 
gttaaaccat 
tgagccactg 
ggtaaagaaa 
caaaatgagg 
atgggaatcg 



gtaaaaat ac 
agtgggagaa 
aacacaagga 
aataaat cct 
aaatttagac 
aaacaagctg 
atgttataaa 
caracattag 
agtcagccct 
atgtttttgt 
taacaactat 
tttaaagtat 
gactctcaaa 
ggtatcgaca 
aactagtata 
gactttcatg 
aatgtgtatc 
ctaccaacct 
cctcctttaa 
aagacagaac 
tgtttatgct 
tgcaaaagaa 
cgtatcaata 
ccatctcctt 
tataaaatcc 
gaactgaggc 
ttacccaggc 
tttttcttct 
aatagttatt 
gaaggaacca 
gtattctggc 
tagrtttcac 
cagcagactc 
gaaagggact 
ttgaagaaat 
tattatgcca 
actgaaatca 
ctggcgtata 
gaggtccttt 
ctaagagctg 
gaacagctct 
ttatcaaatg 
gggaggccaa 
ggtgaaaccc 
tagtcccagc 
tgcagtgagc 
tcaaaaaaaa 
aacttatgtt 
taaaaaggtg 
aggctagcat 
ctctgttgcc 
caggttcaag 
accctgccca 
gagtttggcc 
cgtctggcct 
actcattttt 
tattaactat 
aagttatttt 



tc* t tagat- 
aaat gtaaag 
cagaaaggcc 
ctcgtt zzat 
aaaat gttaa 
tttct naaca 
gttcaatatg 
uttggctatt 
cccta tccag 
accaaacatg 
cttcacagtg 
acaagagggt 
catcagcaga 
gatggcta za 
attttatgtt 
aaaagattac 
caatctcg' t 
gcttatcccc 
attgatagcc 
atattctzgta 
agattaiatt 
gcaacttgcc 
tgtaatatca 
agcactaatt 
caaaaaacct 
gtatacttca 
tcaggttaga 
aatattcctt 
ttaaaagtat 
ctaccaagaa 
atgttacatg 
tatggaaata 
aataatcacc 
gaaagtaaaa 
aaacattctt 
gcagtaaatt 
atcattaaag 
ttatcagagt 
aaaaaataat 
tacattaaga 
atttt caaca 
tcaaaactga 
gatgggcgga 
catctctata 
tactagagag 
tgagatcgtg 
aaaaaaaaag 
tactatatct 
aggatgagaa 
aataaaaata 
caggctggag 
caatccttgt 
gctaattttt 
aggatggtct 
aaagtgtctt 
agtgaaataa 
ttcggcttct 
attcctaagt 



ac ugaagcaa 
aaaaaaagga 
tat-gaaata 
aactacgaaa 
gagtaagtac 
tacgtcaat t 
argtaaaaca 
ccaaatntca 
gggttctgca 
tacaggctt- 
tgtacatgtg 
atgcataggt 
atttggtaac 
tataaaccac 
gttcacataa 
acccaagata 
taattataac 
tccaagcaat 
ttctttnaaa 
aaatgctccc 
tctaagctga 
taaagatttc 
atataatcaa 
attacaaaca 
tgaaaattta 
ttaatgagta 
aataaagata 
aatgataacc 
gagtaattag 
tcaaagccta 
aaaatcactt 
ggtaagtgat 
ctaaggggca 
tgcactaatg 
tggacaggaa 
aggaaactaa 
cagcagcaag 
tgacaattct 
ataaaccagg 
ttttarttgr 
gttataacat 
ggccgggtac 
tcacttgagc 
aaaaatacaa 
gctgagggag 
ccactgcact 
aaagaaagaa 
acrtatattc 
agaaaatagt 
tgagtgtctt 
tgcagtggtg 
gcctcagcct 
gtattttcag 
caaactccca 
attataacca 
ttaaaactgc 
aaaattaccc 
ttgagacttc 



"040 
.7 100 
"16C 
"22C 
^280 
17340 
1^400 
L~4 60 
I7S20 
1^580 
17640 
17700 
17760 
17820 
17880 
17940 
15000 
18060 
13120 
13180 
18240 
18300 
18360 
18420 
18480 
19540 
18600 
18660 
18720 
18780 
18840 
18900 
18960 
19020 
19080 
19140 
19200 
19260 
19320 
19380 
19440 
19500 
19560 
19620 
19680 
19740 
19800 
19860 
19920 
19980 
20040 
20100 
20160 
20220 
20280 
20340 
20400 
20460 
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atgttttaat gtgatcacta aaaatttcct 
aaattccaga attttagctg tttcaatcrc 
actttctgtg catgcacttt ctttattaga 
aaaaggaaga gtaataagaa gcctgatgtg 
aaaaagttat gacagaagag gcataaaaaa 
aataatgatt aagagcatag gctataaagc 
ctcctctaat tactaggtag gtaaccctga 
ttacctcagg tatataaagg ggacagtaac 
aataaataca tgtaaaataa tctaaaacag 
ttagctgcta ttattattca tctaaacttt 
taaaaatatt gaataaaaca atgacctagc 
tgatttcact taataataac tttagtagtt 
ccagctataa ataactcaaa taatttgcca 
ataaagcatt tcctaaaaaa gttctaarac 
aacaaaatgg caaatcatct gcatcaaata 
taaaatatat ctgctggaaa aagcaactga 
ctattccaat aaagctggag gaggaagggg 
taatagttgt tttcagtttt caaaaatcca 
aagtctcaat ctcagcgtag tagaragctt 
ccccctacag gactcaattt acctatttct 
tcaagtttta cattaacaat attaatgcta 
ataggaggaa acagtctctg agaaccatct 
ttgtccttga ggaattaata gtttactgct 
ttaaaaatag ctcatgatat cctctatgat 
tgaagatcta agatccaagt tctactgttg 
gtacaagtca gttttgggga agctgtctta 
ttcttccagc ctctatggct ctaatattcc 
aggaaatgtt tcaaaaacag acttcgcaga 
gcatatgtga agaaatcaag gaagacttct 
aagcactctg ggagccaagg ctattcccag 
aagatgttta ggggaatagc atgcagtgtt 
aacatcaaat taatatcagt ataaaactca 
aaatctaaga accactaaaa tagttcatct 
tgcaaatggc aagaagggaa taaatgaaga 
-caaaagtgat caaaagagtt attccaaagt 
aaagaggaaa ctggacactg aaacagaaga 
gtagattggt gggaccagtt agaacctcac 
ggccaggtgc ggtggctcat gcctgtaatc 
tcacctgagg tcaggagttc aagaccagcc 
gtctgtacta atacaaaatt agccaggtgt 
aggaggctga ggtaggagaa tcgcttgaac 
tcgcaccatt gcactccagg ctgggcaaaa 
aaacaaaaca aaacaaaaca cagaaataca 
atgttccact ggtcataaaa caaaagaata 
gttaaaataa ctcacagcaa aattataatg 
ctatagtgtg caatttaatt tattatgtgc 
tctaattttc acaataaccc tattttacag 
tgaacgagcc aaatcaccta gttacctgga 
ctctcaatct taaccacatg ctatactgat 
ttcaaggtta tcggaaaacc tatgtagata 
cttttacaga aagcaatcac tgatcatcta 
tgagttgaaa tttttatatt ttataaataa 
aaaacacctc agtttttatt ctcttcccca 
gaggttgaat cattaaagtg gtgatatcat 
actctcctcc ataaaagcaa caagaacaca 
ctttcaaaag ccccactctc agaaaactgt 
acctccctca taggacatta tttgacttga 
tcaccaggag agtttgtgga aaatcagtgg 
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aattgatgat taggaaaaca actttctgta 20520 

ttcatactaa ggggagaaca rtatgtctcc 20580 

agaaaatgga ctgagggcag -aagcaaccg 20640 

tgtgaaaact ggagaacagt ctcaaa ccac 20700 

taaaagtaat gaacttaata tatgaaaggt 20760 

cagactggac tccctggatt caaatcctgg 20820 

gcaagtttca atgaccaatc tttttctcaa 20880 

agcatttaac ccagaggaca ataaggatta 20940 

tacctggtat tcaataaagc gcaataaacg 21000 

actttcatca ccagcaata- tttttaatct 21060 

ttagtaaa.a aattcataat gagaaaatgt 21120 

tgggataaca ctttgcatat tttaatttcc 21180 

tcagatgatc tgttattttg aagttaacaa 21240 

ataacttttg ctctcatctt atgttttaaa 21300 

gttcctactc ttataacatg acaattgttt 21360 

agtcctagaa aatagaaatg taattttaaa 21420 

aaaaacatat ctgccaaata agcttataat 21480 

cataggaagc aatttaagcc taaattgcct 21540 

agggcaatca aaacttgctg tgttgggccg 21600 

tttaaaaggt gtgtaagtag gaaatatgat 21660 

aagcagatga ttatcattca cgcattcact 21720 

atagagatac agagagaaat gaaacaatcc 21780 

tacagagaaa ctacatacat ggtgaaatat 21840 

attatgtttg ctatagaaaa agaacaaggc 21900 

gctctgccat caaacaanaa gctaaacaat 21960 

ttcccaaaat gaggaggtta aattagttaa 22020 

acagttacat ttgtcaaaac aaaaggtaga 22080 

aagaacatct atatgatatg aagggctggg 22140 

tgaggaaggt gacatctgaa gtaactttag 22200 

gagttaacag agtcagataa taaaagatca 22260 

atttggttgc agtctagcta tattttagga 22320 

acagaatgga gggagaaaaa gcaggtagaa 22380 

agaagataaa ggacccatga gctaaatcag 22440 

cagttctggt ccatragaac tgcaactcaa 22500 

attgacctgg taacttgaag aaaagtaaag 22560 

agtagattat gtatttggta gtgaatggaa 22620 

agagaagaac tatgttaaga ccagaaatac 22680 

ccagcacttt gggaggcctg ggtgggcgga 22740 

tgacaaagat ggagaaaccc tgtctcccct 22800 

ggtggtgcat gcctgtaatc ccagctactc 22860 

ccgggaggcg gaggttgcag tgagctgaga 22920 

agagcgaaac tcttgtctca aaaaacaaac 22980 

tcaattaaaa aagtgagcta ttcaccagat 23040 

caggaggcat gacaagccat catcattgct 23100 

atttaagtca ataacatcta ataattccag 23160 

caggcacaat agtttattaa aggtattacc 23220 

attataaaat ggaggcccag agatgtaagg 23280 

atataaactc agaactgcct aaatcaaaag 23340 

gcatgtcaaa gattcaattc attcagattt 23400 

aaaatttcca aaataatcaa ggatatgtaa 23460 

ttgcaatact catgttctta agcaatatac 23520 

ttagaaagaa tacatttttt aaaactttaa 23580 

aatttcaaca aaatccattt atccaaactt 23640 

cagtaatagc agagtgagga ccctgaatat 23700 

aaaattctca aaatgaactt tttctgaaat 23760 

cattatttga tctgccagtt ccctagaaaa 23820 

ctcagagctc actcagtgca aacaatttta 23880 

caattgttaa acatcacatc tgccatgaga 23940 
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tagcaataac agatgggaca aacaagctaa 
aagaaatcca aagggggtct gaaaagttcr 
cacatgtata gagctgtgta cacgctcaaa 
tatgggaaac cctgaggctc tgtacaagaa 
cgtatcattg aaggcaatgc cccaacattc 
tactctagtt ctaggcattc aagaaaatct 
ccaagcagta actttagggg cctgtgtgat 
ggaaagaaac taaacaagca acagcaacaa 
atctggtttc cagagttatt ctgttatact 
aaattacaaa gacatgcaaa gaaacaagta 
gaaactggcc ctgaaaaaga ccagatgctg 
attttaaata tgcgcaaaga actaaaaaaa 
agaacaatat ttctgatcct tcagaagaac 
tggtctagaa cttcttaaaa acagaatcat 
tactcaacac aatgttgtgt gagatttatc 
aaatagaaat tatagagata aataggagtt 
ttgaaaagca caaaaactga atcaacttga 
agaatgaatc agcaaatcta aagataggtc 
aaggaaggaa aggaggctca gagacccaag 
aatgagaggc ccagaagaag atgcagaaaa 
ctaaacttcc cgaacttgac cccaaaaatt 
aaaaagaata aaatcaaagc gatccacacc 
taaagagaga ctctcaaaac aggcaaggga 
caaatttctc atcagaaatg atgttgtcaa 
gaaagaagta gaatgtctgg gacctggaat 
gggtggccaa ggtgggagga tcacttgagg 
aaagaggctc tgtctctaca aagaataaaa 
tagtcccagc tactcaggcg gctaaggtgg 
tgcagtgagc tatgactgtg ccactgcact 
aaaaatgtca accaaaaact acatgcagaa 
tgaagctctg aaggtgctta agactgtaga 
ggaatgtaag aaaattaaga cagccttgtt 
ttgcactgtt ctggttattg tcaagctatg 
cagaacagga tataaaatct tatcaggtaa 
aacttgaagg agaaggaata aggaaccaac 
gcttaaggta aaacaaacag ggaaataaaa 
ctaatctaac aaggaggggc ttaaactgat 
aaaaaacttt caggagtttc accagtccat 
ttgggctacc ctctttgggt cccctccctt 
atcttgcaac tgcactcttc tggtccgtgt 
ccatccacca ctgctgtttg ccgccatcgc 
tctagcaggg tgtccgttgt gctcctgatc 
ggctaaagac ttgccattgt tcctacgcgg 
gaacactagt cactgggttc cacggttctc 
taacactcac cgcgtggccc aagattccat 
ggtcagagaa cacgaggctt gccatcatct 
ctgggagcaa ggaccccctg gtaacaattt 
catgaaggga tctccaaagc ggtaatattg 
ccttagaatt ggaggaaaat actgggcacc 
cgccagactt tagactcagg tatgaggcta 
cccttctggg ttgggaacct tggtctgcct 
ggaagccaag ggctgactag aggcagaaag 
ttgagatcat gtcgcagcca gaagtctcta 
cttcccttct gtcccacacc tcctgggtcc 
aaaattctcc tcacctctga atctacttcc 
tgagactttc atttcctcta gcaagttgta 
tgcgccctta ggcatctagg ctataaaccc 
tttaggtata cagctctaga catgggcagt 
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ccaaaaaatt aaaagaaaaa cccgggaaa- 24000 
aacatatttc tgataatcca gaaagccata 24060 
aaacatctac gaaggccc-a aac:ctcac: 24120 
gaaagtaaaa tccagctaca aat -gc-cg;: 24180 
acacataggc ccctggcaaa gattggaaga 24240 
cttccaatca tcagatga.c actaaactca 24300 
aaaaaataaa aacctgaaag aattagttca 24360 
caaaaacaga ccttgggaaa ggggggaagc 24420 
atataaaata ttcaggtctc aacaacaaca 24480 
taagccacaa actgggggga aaaagcagca 24540 
gacttactgg acaaagact- taagagaqt- 24600 
agittatcta aagaaccaca ggaaagtatc 24660 
cactttttgt cactacagac tagttctgtr 24720 
agagtatatt ctctttata* cagctctt" 24780 
catgttgttg catgtatca- tcccaaacag 24840 
acaaaaaagt accaaacaaa aattctggac 24900 
ggggcrcaac agctgatttg ggcagccaga 24960 
aattgcgaga aagagaggga agaaggaagg 25020 
agacaccatc aggcatacca atatacatar 25080 
agggtcagag tatctgaaaa aataatggcc 25140 
aatctacaca tccaagaaga taaacaaac- 25200 
taggtacatc ataatcaaa- gactgaaata 25260 
cttatgtaca aaacatcttc agattaataa 25320 
taggcaatca gatgacataa tcaaagcact 25380 
gctggtggac acctgtaatc tcagtatttt 25440 
caaggagttg aagaccagcc tgggcagcag 25500 
agattggctg aatgtggtgg tgtggacctg 25560 
aaagatcgct tgagcccagg agttggaggc 25620 
cttgcagtgg agaccctgtc tctataaaga 25680 
aaactgcact tcaagaaatg atcagtacct 25740 
tcaataccat agaaaataat ttagtattta 25800 
tgataactac acataatact gtaactgttc 25860 
agcacaaact gatgactgaa atacagaata 25920 
agttaggcaa gcaattacta gttgtaattc 25980 
tcaaaccagg cagcaatgaa ttgtaaaaaa 26040 
caactcagaa cctaagcata tcgtaagaac 26100 
tactttacag cttgggtgca atcatcccac 26160 
aaactatttg gttattagaa aatagcttta 26220 
tgtatgggag ctctgttttc actctactaa 26280 
ttgttacggc tcgagctgag ctttcactcr 26340 
aggcctgcca ctgacttcca tccctctgga 26400 
cagtgagacg cccattgccg atcccgactg 26460 
ctaagtgccc gggttcatcc taattgagct 26520 
ttctgtgacc cgtggcttct aatagagcta 26580 
ttattggaat ccatgaggcc aagaacccca 26640 
tagaagcagc ccgccaccat cttcggagtt 26700 
ggcgaccaca aagggacctg aacccgcaac 26760 
gaccactttt gcttgctact ctggccratc 26820 
tgtcggccgg ttaaaaacga ttagcatggc 26880 
tctggggaag ggctttctaa caaccctcaa 26940 
ggagccagct tccactttca attttcctgg 27000 
ctgtcgtccc gaactcccgg cattagccgg 27060 
ctcaacagtc gcccatgcgt gcgctcctac 27120 
caaccacgac tttcttgaaa gtgtagcccc 27180 
tctgatccct gcctcctagg tactaatggt 27240 
tctccaaagg gatctaagga agctctatgc 27300 
agggagtctt gtccctggtg tccctcctga 27360 
tatgtgggac ctgttcccca ccacccttgc 27420 
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cagggcccca agtttgtaaa tggcraagag 
cagtgagaga cagacagaga cagagagaga 
ggaggacagg gagagagaca gagaggagag 
gagacaaaca gggagtcaga gaaagaaaga 
tgccctattc ctttaaaagc cagggtaaat 
tctccgcgac cctataacac tccaatacta 
ctgaaaacac taagaccact gacaacccat 
gtgacctgcg gatggcccaa atgcattcaa 
aaaagtagaa aagtaacttt ragaggaaac 
attattctaa gtcaaaaaag caaaaaggta 
ggctattctg tcagaaaaag gtaatttaac 
agatttcctt acaggggatt caaatcttaa 
aggaactccc ttcaggacag gatgatagat 
acaatgggta ttcagtaatt gatagggaga 
ctaataattg gtctcctcaa acgtcagagc 
taccgaatca aaaagactat ctcaatcctg 
acgaatttgc ctaagaactg ttgtttatgg 
tatgaaatac tcaggaactc agcctagctc 
ttgggcacgc tggtaaagga ccactagaat 
aagaaaggcg ggaaaagggg tgagggctgc 
cagaggccca tgggtggtta cacaccccgg 
gctctaggac taatgctcat cggaaaatga 
ttcagatagg aaacgttccc ctcaaggcaa 
gggaccaatt tgactctcag atgctaagaa 
tggcaacgat atactcttta agggggagaa 
aacaccatct tacagctaga cctcttttgt 
tacgtacaaa ctttcttttc attaagagac 
tgccctacag gaagccctca gagtctacct 
ccaaataata aggacccccc ttcaacccaa 
aacaactaac caaagaatgc caatattccc 
gaattcggcc cagccagagt gcacgtacct 
acctaggtaa attctcagat aaccctaatg 
aatcctttga tctgatatgg agagatataa 
atgacagaag tgtcgccgta actgcagcct 
aggtcaatga taggtcgaca acagaggaaa 
ttcccagtgt agaccctcac tgggacacag 
atttgctaac ttgcgtgcta gaaggactaa 
caatgatgtc cactataaca cagggaaagg 
taacggaggc attgaggaag catacctctc 
aatcttaaag gataagttta tcactcagtc 
gtctgcctta ggcccggaac aaaacttaga 
ttataataga gatcaggatg agcaggcaga 
cgctttagtc atggccctca ggcaagcgga 
ggcaaatcaa atgcctaata gggtttgctt 
agattgtcca aatagaaata agccgccccc 
ctgtaaggcc cactgcccca ggggacgtag 
gatccagcag caggactgag agtgcccggg 
agagccctgg gtatgcttga ccattgacgg 
tgtggccttc tcagtcttat tttcctgtcc 
ccaaggggtc ctaggacagc cagtcactag 
gggaacttca ctcttttcac atgcttttct 
agggagagac attctagcaa aagcaggggc 
gtttgttgtc ccctgcttga ggaaggaatt 
tatggacgag caaagaatgc ccgtcctgtt 
ccccaccaaa ggcagtaccc ccttagaccc 
gacctaaaag cccaaggcct agtaaaagca 
ggagtacaga aacccagtgg acagtggagg 
gtcactgtcc ctctatacct agctgtacct 
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aggaaacaga gagagacaga gagaaagac^ 2 7 4 8 C 
gagagacaga gaggagagag agagagacag 27540 
ggagagagac aaagaggaga aagaggcaga 27600 
caaagataga aatagtaaaa aaaaacagtzg 27660 
gtaaaaccca taattgataa ttgaaggtcc 27720 
ccttgttgtc agcgtaaaca agggcgtagc 27780 
agccttccta tcaaaaatcc ttaacatcca 27840 
cctgtagcgg caactgctcc gctaacagaa 27900 
ctcattgtga gcacacctca ccggtccaga 27960 
gcttattaac tcaaaaatac taaagtatgg 28020 
actaaccact gataactccc ttaaccctgc 28080 
ttaccataca aaggtccgac cagacctagg 28140 
ggttcctccc aaatgactga ggaaaaaacc 28200 
ctc-tgtgga agcagagtca gaaaaattgc 28260 
tgtctgcacc cagccaagcc ttaacgract 28320 
actcaaaagc ttacttatac cctctctgaa 28380 
gaargcatct tgatggagca gctgggttgt 28440 
taggactcac ccctgagcac aaaggcaatg 28500 
ccagcagccc ggaccccttc ctttgtgatc 23560 
tacatcagtg agcataacta atccgataag 28620 
aaaggaataa gcattaggac catagaggac 28680 
ctagtggtgc tggcatcccc atgttctttt 28740 
aaacacccct aagatgtatc ctggagaatt 28800 
aaaaaagaca tattcttctg cagtaccgcc 28860 
acctggcatc ctgagggaag cataaattat 28920 
agaaaagaag gcaaatggtg tgaagtgtca 28980 
aactcgcaat tatgtaaaaa gtgtgattca 29040 
ccctacccca gcatccccca gactccrtcc 29100 
acggtccaaa aggagataga caaaggggta 29160 
cgattatgcc ccctccaagc ggtgggagga 29220 
ttttctctct cagactttaa attaaaatag 29280 
gctatattga tgttttacaa ggtttaggac 29340 
tgttactgct aaatcagaca ctaaccccaa 29400 
gagagtttgg cgatctctgg tatctcagtc 29460 
gagaacgatt ccccacaggc cagcaggcag 29520 
aatcagaaca tggagattgg rgccgcagac 29580 
ggaaaactag aaagaagcct gtgagttatt 29640 
aagaaaatcc taccgccttt ctggagtgac 29700 
tctgtcaact gactctactg aaggccaact 29760 
agctacagac attaggaaaa aacttcaaaa 29820 
aaccctattg aacttggcaa cctcagtttt 29880 
atgggacaaa tgggataaaa aaaaggccac 29940 
ctttggaggc actggaaaag ggaaaagcta 30000 
ccagtgcggt ctacaaggac actttaaaaa 30060 
tcgtccatgc acctcgtgtc aagggaatca 30120 
gtcctctgag tcagaagcca ctaaccagat 30180 
gcaagcacca gcccatgcca tcaccctcac 30240 
ccaggaggct aactgtctcc tggacactgg 30300 
cagacaacgg tcctccagag ctgtcactat 30360 
atacttctcc cagccactaa gttgtgactg 30420 
aattatgcct gaaagcccaa ctcccttgtt 30480 
cattatacac ctgaacatag gagaacaccc 30540 
aatcttgaag actgggcaac agaaggacaa 30600 
caagttaaac taaaggattc tgcctccttt 30660 
gaggctcaac aaggactcca aaagattaag 30720 
tgcaatagcc cctacaataa tccaacttta 30780 
ttagtgcaag atctcaggat tatcaatgag 30840 
aacccttata ttctgctttc ccaaatacca 30900 
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gaggaagcag agtggcttac agacctggac 
catcctgact ctcaattctt atrtgccttt 
acctggactg tttcacccca agggttcagg 
gcccaagact tgagccggtt ctcatacctg 
ttttactttt agccgccagt tcagaaacct 
attttctcgc tacctgtggc cacaaggttt 
aggttaaata cttagggcta aaattatcca 
gcttatcctc atcccaaaac cctaaagcaa 
tgccaaatat ggattcccag gtacggcgaa 
gaaactcaga aagccaatac ccatttagta 
caggccctaa agaaggccct aacccaagcc 
ttttctttac atgtcacaga aaaaaacaga 
tgagcttgca acccatggca tacctgagta 
ctcattgttt atgggtagtg gcggcagtag 
tacaaggaag agatctgtgt agacatctca 
agacttgtgg ctgtcagaca accgtgagga 
ctcccctatc atatttttct ctttactgtt 
cctccatgct gctgtacaac cagcagctcc 
cttcccagaa atattgatgc cccatcaaat 
actgcccaca cccatatgcc ccacaactgc 
aatactcatt attggacagg gaaaatgatt 
actgtctgtc ggacttactt cacccatact 
caggcaagag aaaaacatgt aaaggaagta 
cctagcccct acaaaggact agatctctta 
tgcctggtaa gcctatttaa taccaccctc 
cctactaact gttggatgtg cctccccctg 
cctgaacaat ggaacaacta cagcacagaa 
cttgtttcca atctggaaat aacccatacc 
actgtagaca caaccaactc ccaatgcatc 
tgcctaccct caggaatatt ttttgtctgt 
tcttcagaat ctatgtgctt cctctcattc 
aagatttata caattatgtt gtacctaagc 
ttgttatcgg agcaggagtg ctaggtggac 
ctactcagtt ctactacaaa ctatctcaag 
actccctggt caccttgcaa gatcaactta 
gaagagcttt agacttgcta acctctgaaa 
aatgttgtta ttatgttatt ttagcggaag 
ttgtcacaga gaaagttgaa gaaattcgag 
aaaaacacca gaccctgggg cctcctcagc 
ggatctctag cagctctaat attgatactc 
gttaagtttg tctcttccag aatcaaagtt 
ccccagatga agtccatgac taagatctac 
tgctccaatt gtaatgatat cgaacgcacc 
ctactatgcc ccaattccgc aggaagcagt 
gcacttgggt tttcctgttg agtgggggga 
gccgactaag aatcccaaag cctagctggg 
gcttgcaact tagctcacac ccgaccaatc 
attagacaaa aacaggaggt aaaaaaatag 
gaaggacaat gatcgggata taaacccagg 
ggtcccctcc ctttgtatgg gagctctctc 
aaaaaaaaaa tagcttaatt gaagaataaa 
atacagttca aactgtaaca gtgttacagt 
gcatttccat catgccctaa aagttccttc 
tacaccctcc tgacctggcc cagaccttgg 
tattagtttt gtctgttcta gaacttctta 
tattggttct ttttactcaa tgtaatgttc 
tattcctttt aatcctgaat agtatgctgt 
ttacctgttg acagatatct gagctattat 
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crtaaggatg ccttcttctg catccctgta 30960 
gaagatcctt caaacccaat gtctcaactc 31020 
gatagccccc acctatttgg ccaggcatca 3:080 
ggcactcttg tcctttggta tgtggatgat 3 1 1 4 C 
tgtgccatca agtcacccaa grgctcttaa 31200 
ccaaaccaaa ggctcagctc tgctcacagc 3I26C 
aaggcaccag ggccctcagt gcctattctg 31320 
ctaagaggat tccttgacat aacaggtt-c 31380 
atagccagac cattatatac actaattaag 3 1 4 4 C 
agatggacac ctgaagcaga agcggctttc 31500 
ccagtgttta gcttgccaac ggggcaagac 31560 
aatagctcta ggagtcctta cacaggtcga 31620 
aggaaattga tgtagtggca aagggrtggc 31680 
cagtcttagt atctgaagca gttaaaacaa 31740 
taacgtgaac ggcatactca ctgctaaagg 31800 
aagtaactaa aatcgtaaat ccccatggcc 31860 
ctcttacccc ctttcaccct cactgcaccc 31920 
ccttaccaag agtttctatg aagaatgcgg 31980 
aggagtttac ctaaaggaaa ctccaccttc 32040 
tataactctg ccactcttcg catgcatgca 32100 
aatcctagtt gtcctggaag acttggagcc 32160 
ggtatgtctg aggggggtgg agttcaagat 32220 
acctcccaac tgacccgggt acatagcacc 32280 
aaactacatg aaaccctcca tacccatact 32340 
actgggctcc atgaggtccc ggcccaaaac 32400 
tatttcaggc cargcatttc aatccctgta 32460 
ataaacacca cttccgtttt agtaggacct 32520 
tcaaacctca cctgtgtaaa atttagcaat 32580 
aggtgggtaa ctcctcccac acgaatagtc 32640 
ggtaccttag cctatcgttg tttgaatggc 32700 
ttagtgcccc catgaccatt tacactgaac 32760 
cccacaacaa aagagtactc attcttcctt 32820 
taggttctgg cattggcggt accacaacct 32380 
aactcaatgg tgacatggaa tgggtcgccg 32940 
acttcctagc atcagtagtc cttcaaaatt 33000 
gagggggaag ctgtttattt ttaggggaag 33060 
aatgttgtta ttatgttaat caatcctgaa 33120 
attgaataca acgtagaaca gaggagcttc 33180 
caatggatgc cctggattct ccccttctta 33240 
ctctttggac cctgtatctt taacctcctt 33300 
gtaaagctac aaatcgttct tcaaatggaa 33360 
cgtggacccc tggaccggcc tactagccca 33420 
cctcccgagg aaatctcaac tgcacaaccc 33480 
tagactggtc gtcagccaac ctccccaaca 33540 
ctgagagaca ggattagctg gatttcctag 33600 
aaggtgacca catccacctt taaacactgg 33660 
aggtagtaaa gagagctcac taaaatgcta 33720 
ccaatcatct atcgcctgag agcacagcgg 33780 
cattcaagcc ggcaacggct accttctttg 33840 
tgtcttcact ctattaaata ttgcaactgc 33900 
ttaatacaat aaaaggaata cattttaagt 33960 
ttcaagagga ccccttcaac aagatattgg 34020 
ttgtccctta ctggttgggt ccatctctac 34080 
cctcagaaga atcatttttt tgtcactaca 34140 
aaaacagaat catagagtat gttctctttg 34200 
tgtgacattt atccatatta ttgcatgtat 34260 
tttaggaata taatgcaatt gtttattcat 34320 
gatggatatt atgaataatt ctgctatgaa 34380 



WO 99/67395 



PCT/FR99/01513 



69 



cacttctgta caatgttttc tcggacatat atct"cattt ttct-gagtg gagctgtca; 34440 
aactgttgga tcagaaagta agcatatctt gaatcttgaa agaaactggt aaaccc:::: 34500 
ctaaagtgat ttgtaccatt ctacactcct actaataacg tatgagagtt ata-ctgccc 34560 
cacagcctrt ttactacttt gttaatcttt ttagtactgt caaccctttt aatcta tcca 34620 
atctagggaa cgtgaagtag tatctcactg ttattttcat tttcctgatg agtaacaata 34630 
tcgtgtatct tttcatgtgc ttattragcca ttcctatatc tttcgtgaaa tagttaac" 34~40 
aaatttgtaa ctaaaggtgc tctcctgagt ttcaggtagt aagcccattc ccctcaagtg 34300 
aataaactac agtcttggaa tgaaaaatta aacacagtgg agacattttt tgta-aagtt 34360 
gttttactct gtgtatgtct ggttcgctta gtctattatt atatgcccca tgaaagcaaa 34920 
cacagtgctt atttcactaa tgagtatcac tagcacatag aactgtgctt gcccaaagca 34980 
tgaactcaat aaatatgtta atgtgtatgc atgcacatac atctacatgc atgtacacct 35040 
atacacacat ataaacatat attaattttt agacccacaa atctaagaaa actaaitc:: 35100 
gagcctctgg tttgaagaat tctcaaatta ttaacatatc tttatgttcc acrccaca:: 35160 
cactgtaccT: gaaatagccc tactgttcta ctttggtaaa tcaggcaaat ttaattttz" 35220 
aaataattaa gatcccaacr aattttaaaa tataatttga aagttaacaa tgaaatacat 35230 
tacataaaaa gaaaatttta aataaaagca aaactaaacc caataagagg aaagaaagtz 35340 
gggctgtatt tctttaatcc tttaaaattc aaatcacaca atgc^ccaac gaaatct" ca 35400 
ttaactgaac caaactatgc ccatgaaaga tctcatatgc aactgctaaa acctcaataa 35460 
acatattcat cttcttgcaa aaaagatatt tctttataat atgcacatac agtatatac- 35520 
attttgaggc agatttgtac tttagtcctt gttccattgc ttaccggctg gctgtccttt 35530 
gtctggtcat tgacctccaa cttaaaaaat aatacttgcc ttgtctaccc cacagaactg 35640 
ttatgaaagt caaacaaggt agcataaagg tattttacaa gatataaagt gctataatac 35700 
agattttaaa aatcactcta catcccataa tactttgttg tacaatttta gagcaatact 35760 
agaaaataac aattattgcc taattgaaaa tccagtcccg aattccataa aatgtatgat 35820 
atgaacatta tagtacatca tattacgagc cccaaataat cactgcttat atagttggtt 35880 
aggatttcct tagtttgttc atatagttta tatatttatg cagtccctat tttgtgagag 35940 
gcattgtgag gagcataaag acataagcac agtacagagc cttagcttct ctacatttac 36000 
taaagaagac ttcttcttgg gtatttaatc aatatttaaa gtattctggg aagaaatgaa 36060 
attaacttca tagactgacc ttagattact atcattacaa aaagatgcct gagtgatctg 36120 
tctttaacat accagtattt atcttataac tgttatattt acttgaatca gaagtgaact 36180 
ccttttaagc actaagcatc cattctatac tttcttgtct ttacatatga gatacaaatc 36240 
atatttttaa aacttttatt tacttttatt ttttagagac ggagtcttgc tctgtagccc 36300 
aggctggagt acagtggcat gatcttggct caccacaatc tccacctcca cttcccaggg 36360 
ttcaagtgaa caaatcatac ttttaagcac agattctcaa catgtatcct agcatgccac 36420 
tgccataact agggtgtgaa ttaagtatta aagacagctt accccaaata ttactgtaac 36480 
atatatctct aaatgaaaaa gaacatatta acaactatac ttggatggga ttctgggacc 36540 
taacccatcc ctctctcccc tttcctccaa attccatctc ctattaacac accagctctc 36600 
ctgagctaag cagctcctgg ggttggggaa gggtgtacat ggagaaagct agaacctcta 36660 
cagtgttttc ctctctggga ggaactagca ggcatacgaa cagaaaaagc tgaataaaag 36720 
gctgaatcct ttctattcct gaggcagaca gagagaagac cagggaacaa agagacttcg 36780 
accaagagcc ctgccaggta ttgatacctt tgatactgag aaaatatctg ggatatgaaa 36840 
tacaaatgct aaataagtat ctttgaaata ggggtaaaag aataaagggt cttgatgagc 36900 
aaaatgggta gtatttttta ataacctgat aatgagcttt aggaaaaggg aaggtcaacg 36960 
ttatggaatg aaaacacaga ggtaccaaat ttaaaagcat aaaaaaaagt ggaggggggg 37020 
aacccaataa cttcatcaaa ctagcaaata acttagtatc atttctaatt agaaacgcta 37080 
gaaggaaatc acttagatct gataaagact aggctataat tctaactgat gaaacactta 37140 
aactgtatca atcaatacca gaaaacaaac acagaaaagt ctactagaac catcattatt 37200 
cagcacagtc ttggtaatgc aatactataa tagcaatgca ataaagcaag aaaaaaaaaa 37260 
gtttgtaaaa acacaatagg atgagatttt tgtttttcca atgccataaa taactagaaa 37320 
tggaaacaaa ataaagaaaa acaaaatcta caaaacacct ggaaataaaa agaaaaatgg 37380 
tctatttgaa gaaaacctta aaatctatgc agaacataaa acaaaatctg aataaaaaga 37440 
aatatcatgt tcttgtctgg gaagacttaa tatcataaga aagtgaatta tatcaaaatt 37500 
taaatcgaaa tttaatgtat ttccatctct aatcagacag gacactatgg ggaactgaat 37560 
aagtgatttt aaaagtcatg gaaaattaat aactgagaat aaccatgaaa agtatgaaaa 37620 
aaggagacaa atgaattgct ccaacagata tcagaacgct aaaattaaat aaaaatacta 37680 
ctaggataag aaaatacata tactgatgta atgaataaag aatccagaat tagattccag 37740 
taagtcaaac tactttacta taaaccaggg gtggcatatt catccagtgg gaaaaggaca 37800 
gtaagaagtg agtaaactat ggcccactgg ccaaattgcg gcctctgcct atttttgcaa 37860 
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ataaagtttt actgggacaa agccaagcct 
atgttacaga atcacacagt ttcaacagag 
actatctggc ccttgaagaa agtttgccaa 
tctcatagac acctatctca cacaacacat 
acggggtctt gctctgttga ccaggctgga 
cctcaacctc ccaggttcaa gtaatgctcc 
tgtgtgccac tacgcctggc taaggggcct 
taagaaaaag aagggcatat ttgatataca 
tcaagatgaa ttacacagtt atattttgca 
taaaaattat tttataaaat atctttaata 
ataaaattat tttataaaat aaaaagttaa 
gcaatttaca gaaaaccaag tccaaatggt 
ctaagtgtga gagaattatt agttaaagta 
aaaaatcaga gttataatgc cctattgctg 
atatactgtt agtgaaaatt taaactaata 
ttttaatctc taccttttga tgcaaaaact 
aaaaatacat atgcttactg tagtactgtt 
cttgatagtg aatactgaac aaatcacagt 
taaaaaagaa taaattaggc tgggtgcggt 
aggccaaagc aggcggatca cttgaggcca 
aaaaccctgg ctctacaaaa aatacaaaaa 
tcccagctac tcaggaggct gaggcaggag 
agtgagccaa gatcatgcca cagcattcca 
acaaaaagaa caaattaaac cctacaactc 
aatgggcaaa ggacttgaat agacatttct 
tgcagagcac tattcattag tgattacatc 
acagaaaata ataaatattg gtgaagatct 
gggaatgtaa agtggtacag ctactacgga 
aaataaaatt atcttatgat aggaatatgc 
aacagggtgt acacccattt caacatttac 
atatttgttc aaatattctt ctggatgctt 
atttaaattg gtggattctg agtacagcag 
ctactcagtt gaaggtctta cagaaaaaga 
gcaacagact gcctttggac tcaactgcaa 
accctggctt ggtgagtcca gggtctgatg 
caaaaccagg aaagccaatt cattaaaata 
ctaccaccac caccatgatg gttctgtttc 
ggcagcatta ttcacaatag ccaaaaggtg 
aaaatgtggt atgtatatac aatggaatat 
ctatctatat ctatacacac atactcacac 
ttcaccatgt tgtcaaggct ggtctcgaac 
cttcccaaag tgctgagatt acatgtgtga 
ctgacacata atacaatata gataaacaat 
tcacaaaaag gcaattagtg tatgattcct 
cataaagtag aatggggaaa cagagagttg 
agaaaagagt tttggagaat gaatgtacaa 
tggttaagat tataaatttt atgttacatt 
ataatattaa ggaaaaatac tataaataac 
cattcacctg ggaaacagaa tacatcctat 
ttattacaaa tgatgttgtg tatctttttg 
aatattcagt ttactaacca gtaagtcctt 
gttattgcaa gatatctact aaaatggaaa 
atcaacatcg ctaaaaccct ggaggggaag 
catatttcta ctgtcctcac ttttcaaaat 
gagtctaaaa tttggctcct tcttcagttt 
agtttccatt ttcaaaaatg tactttttct 
atttttagca catagaagtt aaatagattt 
aaagaattaa aatattaatg gcgctttaat 
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atcatt tgca aactgtcta" aaatatttcc 37920 
accaccttgt ctacaaagcr gaaaataict 3"'93C 
accttagttt atataataaa aqatcagcta 35040 
tgtgggaaag gaccttcct- ttwttCLgag 33100 
ctgtagtggc atgatcargg ctcactgcag 33160 
caccacagaa tcccaaacag ctgggagaga 33220 
tttnaacaga gaaagaaatc cacatactac 33280 
tttatatttt ttatatagat atcataaaaa 33340 
atgtgtttga cggtaaaagt ttaatatcta 38400 
tatttataga tactataata taaaatatct 33460 
gaagaaaaga taggcaaaac aaaatacagc 33520 
caacaaagat aaaacagatt tataaactca 33580 
aaaatatctc tctataccca caatactact 33640 
gtggagatgt aaggggagaa gcatgctctc 33700 
catttttgaa aagtaagctg gcaatttttt 33760 
catttttggg tacctattcc ataccttaaa 33820 
tataatggta aaaactagaa aaaaagaaaa 38880 
gcatctacag attaaacata atgcagccat 33940 
ggctcatgcc cgtaatccca gcactttggg 39000 
ggagttcgag accagcctgg ccaacatggc 39060 
ttagtcgggc atggtggtgg gcacctgtag 39120 
aatcacttga gcctgggaga cagagattgc 39180 
gtccaggtga cagaacgaga ctctgtctca 39240 
atcaacaaaa atacccaaac ccaattcaaa 39300 
tcaaggatga taaacaagca catgaaaaga 39360 
ccacatgcat taggatggct agtatgaaga 39420 
gaaaaacaga aacctttgtg cactgttggt 39480 
aaacagtatg gccattcctc aagaaaataa 39540 
atttctgggt aaatacccca aataactgaa 39600 
atgtcaattc aactgggcca gaatacccag 39660 
ctatatatac gttttttggc tgaggttaac 39720 
attaccatcc acaatgtagg tgggcctcat 39780 
ctgacctccc ttgagcaaga aagaattcag 39840 
ctcttccttg agtcaacagc ccatcccatc 39900 
aggtaggctg cagactcaag gaagagctgc 39960 
aatctctctc tacacaaaca cacacacaca 40020 
tctggagaat gctaatacac ccctgttcat 40080 
gaagcaactc cagcagatga atggagaagc 40140 
tattaagcct ttaaaaagtg gaaattatat 40200 
acacacacac acatttatag aagacagggt 40260 
tcctgggctc aagcaaaccg cctgcctcag 40320 
gccaccacac ccagccaaaa aaaggacatt 40380 
gaggacatca tgatatgcga aataagcctg 40440 
cttgtatgag gtacctatgg atgtcaaatc 40500 
tttaatgggt atagagtttg ttttgcaaga 40560 
cagtgtgaac ataattaaca ctactgaaaa 40620 
tattttacca tgattaaaaa ttaaaacaaa 40680 
aacaacaaaa aaaacacctc aagcaactta 40740 
tctgctagag atatatctgc agttcaaaat 40800 
aaatgactga aaaactaaat taaaagcaat 40860 
ctttcatggt tcctgacttt tctgtaagat 40920 
acaactgaaa aggcaaaatt ataatttctt 40980 
aatcctaaca aacatggcca taatttgcca 41040 
ccagaaatca acatttctgg aaacaaaaca 41100 
agaaggtgcc aagttaatcc ctgacatcct 4 1160 
ctccccaaac cggtatctag attcttaaat 41220 
gcttaaccaa aatagccagt aaacctccca 41280 
gatacaaatg aacaacttta cattcaatcg 41340 
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tcaatgggaa aggaagcaga attctgagga 
tctactttat tttacttutt tgtaactaat 
tacaaaaatt agccaggcat ggcacatgcc 
gggtggatcg cttgagccgg gaaggcagag 
ctcaagcctg ggtgacagag caagaccctc 
ggcgcagtgg ctcacacttg taattccagc 
tgaggtcagg agttctagac cagcctgacc 
tacaaaaatt agccaggcat ggtggtgggc 
ggcaggaaaa tcgcctgaac ccaagaggcg 
gcactccagc ctgggcgaca gagcaagact 
ataaaattaa aaaatatata aaaataaaac 
tttttttttt ttttttttaa agatagggtc 
gcatgatcat ggctcactgc aaccttgacc 
cctcccaagt agctgggact acaggtgctt 
tttttgtaga ggtggggtct cactatgttg 
agaaaacaag cattgtttta tcagcttctt 
ggttgttcct atgaagattc tctaaattta 
aagtagatga ctgaatgatc tttgttgaat 
atctcttaag atctcccatt ctttacagga 
ttttaccttt gcagccttat ccaaactctg 
tacaacgtcc ccctttgcct acaaagctct 
cctatctgtc aaatctctgg gaacgcaaca 
actagaacaa attcttcctg gggcattagg 
agcaatcaca gttccaatgt tatatttgta 
agactataac cttctaaggg gtcacacata 
tagcacaggg catggcaggc aaatatgtgt 
acacactttt cttacccaaa gtataatggc 
gaaaaacaga tatgatgtgc ttaattttca 
attcacagtc attttacaaa tctttttgac 
aagtgctaaa taacattttg gttacattct 
agaatactgg ctaatatgaa gcacctggac 
caaactaaac tgttatgtaa atgacagaaa 
tggcttttgg accaattcaa cttttaccac 
tgagctcatg ataaatgaat tacagatgaa 
aagtttatct tcaaagaata ccaccagtca 
ggtcagggca gacttcactt ttcatgataa 
attacaaaca aaagtcatag tttgctcata 
ccatttttca tttgttcact gaggcaagtg 
catgtaaaat cagataatga ttcctattcc 
gatgggcctc actcaagcat gctcagtact 
tctattagga ttctgcaaag taaaataaat 
gaatctagat tttcagattt tccttaaatt 
agagatttgt atctagtatt ttaaagaaat 
aaatgctaca tttaacaaac agaatatcac 
tcagcaacag aaatctgatg ttgcctttag 
tccatcctcc tttggtcaag gccatggttg 
aagccaggaa atggcaaatt agcaaaaact 
atctcacttc taaaacttta attaaattca 
ccaaaaggaa agttatgtag gtcaaatgag 
tttctgttta aggaaaaact gcccaagtgc 
ctgccgagag tccccatctg gcagccaggt 
cctcccactt tctatctaat tatagcactt 
tctctctctc tctctctctc acacacacac 
tttctctctc tctctctctg aaacttatct 
ttaatctgac aattttcccc taaaacagaa 
acacatgcac tatattctga caataataat 
caggagttta aagaagttac agtaaagaat 
acccaaataa gtgctgagag gtataaatct 



Ctatgaaag" aaacaaaacg aagttcaaa: 4I4CC 
gaacaact tc ttccaaagac aagtagcaa- -I146C 
tgtagtccrg gttacttgga aggcrgaag: -i!52C 
gctgtagcga gctgagatca caccac-gc= 4 1 5 3C 
tctggggaaa aaaaaaaaaa aaataggcrg 4164C 
actttgggag gctgaggcag gtggt-cac; 4 1 7 0 C 
aatatggtga aaccctgtct ccaccaaaaa -11760 
aattgtaatc ctagctactc gggaggctga 41320 
gaggtttcag tgagccgaga ttgcactag- 4 18 8 G 
tcatctcaaa ataaataaat aagtaagtaa 41940 
aaagataagt aggaaccacc cttttccttz 4200C 
tgttcctgat gcccaggctt gagtgtagtg 4206C 
tctcaaatac aagtgactcc cctaccccac 42L2C 
accaccccat ccggctcatt taaaaaaat: 42I8C 
tatccaggct ggtctcattc taactttatt 4224C 
gtttttttaa aactaaaaat aacactgcta 42300 
tttataacct taagaataac atgtacaaca -i 2 3 6C 
aaatatgaat ggatattcaa ataattaaas 42420 
tacagagaaa actcgttaat atggcccgac 42480 
tggtcaagac aaacaggttg tccttatac. 42540 
tctcatgact ctttgcctat cttaagttca 42600 
tttcctcaag gtagccttct ctcctcccaa 42660 
tttttattgc actgtatgtc tcttcttcac 42720 
ttcttagttg atttg-ttct ttccaccttt 42780 
atatcgatca tcagttgtat cccttgtgca 42840 
gtaaataaac ttgttgaatg aatcaacgag 42900 
aggataacat ttatcaatct attgcttctr 42960 
ttttacatct caaataccaa tgcctaagga 43020 
aaatgcct-c attaatcacc acctgrztac 43080 
gtaacattcc ctgcacttaa tgtcatctct 43140 
ttcaggaaca caaacctgaa actaacacac 43200 
tgacacattt tggtctgcaa catctetaga 43260 
taaaaatcgg tcacctgact atagtcattt 43320 
aaataaatag tttgatgaca atctttacaa 43380 
caggtattct aggctcctat caact-attt 43440 
ttatgttctg aaaattctac aaacttaatg 43500 
aatcaggcct aggtctggat tctagttctt 43560 
acttaaaatt ccctagcctc agtttcctca 43620 
taagatggtt ttgaggcttc aacaagataa 43680 
ctgtctctct ctctccggtt atgcagaaat 43740 
atttcagtaa aaattatgcc ctttattaat 43800 
tacttagtaa cttaagggct caaatattat 43860 
gaaaggtgtt aatcaaaatg ctgcacaaat 4 3920 
aaccatacaa actaatcaga tataaagaag 4 3980 
atcacacaat taggcaaaca aaaatagagt 44040 
aagactgaat accaaatagg gaaataggaa 44100 
ggactcctta atttttatat tcactttcat 44160 
aataaaaacc aaaatggaac tgagataaag 44220 
aacctatatt gtccttaggc tctttgttgc 44280 
cttgacacat taaagatcaa gcaggaggtt 44340 
tttgtcaagc aaattttgag aattctctac 44400 
tataaaaacc attctctctc tgtctctgtc 44460 
acacacacac acacacacac acacacaccc 44520 
gtattataat aacacaacac taggtatgga 44580 
taaattcaaa aaggaaaacc ttccc^ctgt 44640 
tcctaaatta agtataatac attttcccta 44700 
ctcttgtata aatatatatg ccagaacttg 44760 
caaaacagtt tccggactct ttgtgaaatg 44820 
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tcttcagagt ctgcgacata ttttcttcaa 
gctgtgggaa tgccttacgg catgttac-g 
aataatcaaa ataaaattga caaatgataa 
gggcactttt ctagaacctg gacacaaagc 
aaaatatgga ctatttgaaa attatacctg 
agtatattga gatgtttact ttcaattaga 
atgtgatggc tctataaaag attctaaaat 
tgggatacta aaaatggcta caaagaaagt 
tcctactaga ttagagtcta agcctgtgac 
ttttctcatt aatagtatgt aacttacttc 
atatttgcta aatgtcaata tttatgccag 
tttacctcat gcaaatatgc tgtgagaaag 
caacactgaa gactcaccat ccaaaacaaa 
agttctgttc tataaggtta ccacaaacac 
ttatgtttcc gtgagccctc ggtcacaaca 
ttctatgtgt gtttctgttt aaaaagagca 
acagcaaaat cactaataaa aagcacaaaa 
acaagaaggc ttgtttatag tatgacagct 
aacctctgct gggaaatgag catcaggtga 
aaagtgctcc aagtactgac tttggggtta 
ccaatatgaa atctacaaat aatgagtacc 
gtatctgact tgattgccac tgaaagacac 
agttactatg cagacaaaga gttctacact 
tcataaatgg atgtttttta aaatgttatr 
acgaaatcca ttttcttctg caggatattc 
gtcaaatctg tctgtaatga 



72 

ctaaattana caagtaagat attttgctgg 4 4 880 
tggagctcat ggtaaaatag aaagaatata 44940 
atgatttaat aaattagaaa tzcaaazqcz 45000 
acgaacctaa caataacccc gcctccatga 45060 
caacactaaa taaatattcr tcattcttcc 45120 
caatttgctt tcctctcnga acacatagtt 45130 
aactatagaa ggaactactg gtaaagaccg 45240 
tatgacaaaa cctctgagtt tgaatggaag 45300 
attatgcttc tggtrcttgt tcttaaatgc 45360 
ctggaatgcc attcattaaa aaaarattta 45420 
cacttttaaa gtacagaaac atggagtLtc 45430 
acttaagagc ctattgccca ctttgtggta 4554C 
cagacttagt aaattcttgt gatttgcagt 45600 
-gaaatcatc gctcctgggg gaatacaagg 45660 
tgttcattaa ctgatcaata cacaaccttg 45720 
cttcagtgct acatttggag tc-gttttaa 45780 
atgtaaaagc atggcactac atacactgrg 45840 
gagacaagaa ggtagagcct cgctttgacc 45900 
accaattttt caccactctg aatgaccgca 45960 
cacataaatt ttagtaagca tgtgaatctg 4 6020 
aaatgcatat gagtcaaata tttcagtgcg 4 6080 
agtttggaaa acccctaata aataccgttt 46140 
agagtgcttc aattaagatg tctgaggctt 46200 
tcctacctga tatattctaa aggggatata 4 6260 
catgagtttc cgattgatgg cccaaaactg 46320 

46340 



<210> 67 
<211> 773 
<212> ADN 

<213> Homo sapiens 
<400> 67 

actgagagac aggactagct ggatttccta 
gaaggtgacc acatccacct ttaaacacgg 
gaaggtgacc acaccctcct ttaaacacag 
caggtagtaa agagagctca ctaaaatacc 
aatcaaatca tctatcgcct gagagcacag 
aggcatttga gccagatcag gtaaccctct 
gttttcactc tattaaatct tgcaactgca 
aagctgagct tttgctcgcc gtccaccact 
gacttccacc cctccggatc cggcagagtg 
cattgccact cccgatcagg ctaaaggctt 
gttcatccta atcaggctga acactggtcg 
cagcttctaa tagagctata acactcacca 
atgaggccaa gaaccccagg tcagagaata 



ggctgactaa gaatccctaa gcctagctgc 60 

ggcttgcaac ttagctcaca cctgaccaag 120 

agcttgtaac tcagctcaca cccgaccaat 180 

aattaggcta aaaacaggag gtaaagaaat 240 

ggggagggac aatgatcggg atataaaccc 300 

ttgggtcccc tcacactgta tgggagctct 360 

cactcttctg gtccatgttt gttccggctc 420 

gctgaatgcc gccattgcag acctgccctt 480 

tccgctgcac tcctgatcca gcgaggcacc 540 

gccattgttc ctgcacagct aagtgcctgg 600 

ctgggttcca cggttctctt ccatgactca 660 

catggcccaa ggttccattc gttggaatcc 720 

aaaggcccgc cccatcttgg gag 773 



<210> 68 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 63 

Phe Leu Gly Glu Glu Cys Cys Tyr Tyr Val 
1 5 10 
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<210> 69 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 69 

Leu Leu Phe Gly Pro Cys lie Phe Asn Leu 
1 5 10 



<210> 70 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 70 

Cys Leu Pro Leu Asn Phe Arg Pro Tyr Vai 
1 5 10 



<210> 71 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 71 

Gly Leu Leu Ser Gin Trp Met Pro Trp lie 
1 5 10 



<210> 72 
<2U> 9 
<212> PRT 

<213> Homo sapiens 
<400> 72 

Cys Leu Pro Ser Gly He Phe Phe Val 
1 5 



<210> 73 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 73 

Trp Met Pro Trp lie Leu Pro Phe Leu 
1 5 



WO 99/67395 
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<21C> 74 
<211> 10 
<212> ?RT 

<213> Homo sapiens 
<400> 74 

lie Arg Trp Val Thr Pro Pro Thr Gin lie 
1 5 10 



<210> 75 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 75 

Leu Arg Asn Thr Gly Pro Trp Gly Leu Leu 
1 5 10 



<210> 76 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 76 

Leu Arg Thr His Thr Arg Leu Val Ser Leu 
1 5 10 



<210> 77 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 77 

Lys Arg Val Pro lie Leu Pro Phe Val lie 
15 10 



<210> 78 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 78 

Cys Arg Cys Met Thr Ser Ser Ser Pro Tyr 
1 5 10 
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<210> 79 

<21l> 10 

<212> PRT 

<2I3> Homo sapiens 

<400> 79 

Thr Arg Val His Gly Thr Ser Ser Pro Tyr 
1 5 10 



<210> 80 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 80 

Ala Arg Glu Lys His Val Lys Glu Val lie 
1 5 10 



<210> 81 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 81 

Ser Arg lie Giu Ala Val Lys Leu Gin Met 
1 5 10 



<210> 82 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 82 

Ser Gin Trp Met Pro Trp lie Leu Pro Phe 
1 5 10 



<210> 83 

<211> 9 

<212> PRT 

<213> Homo sapiens 

<400> 83 

Cys Tyr Tyr Val Asn Gin Ser Gly He 
1 5 
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<210> 34 
< 2 1 1 > 9 
<212> PRT 

<2I3> Homo sapiens 
<400> 84 

Phe Tyr Tyr "Lys Leu Ser Gin Glu Leu 
1 5 



<210> 35 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 35 

Thr Tyr Thr Thr Asn Ser Gin Cys lie 
1 5 



<210> 86 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 86 

Ser Phe Leu Val Pro Pro Met Thr He 
1 5 



<210> 87 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 87 

Tyr Tyr Val Asn Gin Ser Gly lie Val 
1 5 



<210> 88 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 88 

Leu Phe Asn Thr Thr Leu Thr Gly Leu 
1 5 
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<210> 89 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 89 

Leu Phe Gly Pro Cys He Phe Asn Leu 
1 5 



<210> 90 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 90 

Arg Trp Val Thr Pro Pro Thr Gin He 
1 5 



<210> 91 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 91 

Leu Pro Phe Leu Gly Pro Leu Ala Aia He 
15 10 



<210> 92 

<211> 10 

<212> PRT . 

<213> Homo sapiens 

<400> 92 

Leu Pro Tyr His lie Phe Leu Phe Thr Val 
15 10 



<210> 93 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 93 

Gly Ala Leu Gly Thr Gly He Gly Gly He 
15 10 
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<210> 94 
< 2 1 1 > 10 
<212> PRT 

<213> Homo sapiens 
<400> 94 

Leu Pro Phe Val He Gly Ala Gly Val Leu 
1 5 10 



<210> 95 
<211> 9 
<212> PRT 

<213> Komo sapiens 
<400> 95 

Arg Arg Pro Leu Asp Arg Pro Ala Ser 
1 5 



<210> 96 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 96 

Phe Arg Pro Tyr Val Ser lie Pro Val 
1 5 



<210> 97 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 97 

Arg Arg Ala Leu Asp Leu Leu Thr Ala 
1 5 



<210> 98 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 98 

Trp Arg Met Gin Arg Pro Gly Asn He 
1 5 
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<210> 99 
<211> 10 
<212> PRT 

<2 1 3 > Homo sapiens 
<400> 99 

Asd Arg lie Gin Arg Arg Ala Glu Glu Leu 
1 5 10 



<210> 100 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 100 

Leu Arg Thr His Thr Arg Leu Val Ser Leu 
1 5 10 



<210> 101 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 101 

Glu Arg Val Ala Asp Ser Leu Val Thr Leu 
15 10 



<210> 102 
<2U> 10 
<212> PRT 

<213> Homo sapiens 
<400> 102 

Leu Phe Gly Pro Cys lie Phe Asn Leu Leu 
15 10 



<210> 103 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 103 

Gin Phe Tyr Tyr Lys Leu Ser Gin Glu Leu 
15 10 



WO 99/6739S 



PCT/FR99/01513 



80 

<210> 104 
<2U> 10 
<212> PRT 

<213> Homo sapiens 
<400> 104 

Gin Tro Met Pro Trp lie Leu Pro Phe Leu 
1 " 5 10 



<210> 105 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 105 

Cys Tyr Tyr Val Asn Gin Ser Gly He Val 
1 5 10 



<210> 106 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 106 

Asn Phe Val Ser Ser Arg lie Glu Ala Val 
1 5 10 



<210> 107 
<2il> 9 
<212> PRT 

<213> Homo sapiens 
<400> 107 

Gly Pro Leu Val Ser Asn Leu Glu He 
1 5 



<210> 108 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 108 

Leu Pro Leu Asn Phe Arg Pro Tyr Val 
1 5 
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<210> 109 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 109 

Leu Pro Phe Leu Gly Pro Leu Ala Ala lie 
15 10 



<210> 110 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 110 

Glu Pro Lys Met Gin Ser Lys Thr Lys lie 
15 10 



<210> 111 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 111 

Leu Pro Tyr His lie Phe Leu Phe Thr Val 
15 10 



<210> 112 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 112 

Arg Glu Lys His Val Lys Glu Val lie 
1 5 



<210> 113 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 113 

Lys Pro Arg Asn Lys Arg Val Pro lie Leu 
15 10 
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<210> 114 

<211> 9 

<212> PRT 

<213> Homo sapiens 

<400> 114 

Val Val Leu Gin Asn Arg Arg Ala Leu 
1 5 



<210> 115 

<211> 10 

<212> PRT 

<213> Homo sapiens 

<400> 115 

Ala Val Val Leu Gin Asn Arg Arg Ala Leu 
15 10 



<210> 116 

<211> 9 

<212> PRT 

<213> Homo sapiens 

<400> 116 

Leu Pro Phe Val He Gly Ala Gly Val 
1 5 



<210> 117 

<211> 9 

<212> PRT 

<213> Homo sapiens 

<400> 117 

Asp Leu Tyr Ser Tyr Val He Ser Lys 
1 5 



<210> 118 

<211> 10 

<212> PRT 

<213> Homo sapiens 



<400> 118 

Thr Glu Gin Asp Leu Tyr Ser Tyr Val He 
1 5 10 
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<210> 119 
<211> 2615 
<212> ADN 

<213> Homo sapiens 
<400> 119 

gaattccggg aagccagacg gttaacacag acaaagtgct gccgtgacac tcggccctcc 60 
agtgttgcgg agaggcaaga gcagcgaccg cgcacctgtc cgcccggagc tgggacgcgc 120 
gcccgggcgg ccggacgaag cgaggaggga ccgccgaggc tgcccccaag tgtaactcca 180 
gcactgtgag gtttcaggga ttggcagagg ggaccaaggg gacatgaaaa tggacatgga 24 0 
ggatgcggat atgactctgt ggacagaggc tgagtttgaa gagaagtgta catacattgt 300 
gaacgaccac ccctgggatt ctggtgctga tggcggtact tcggttcagg cggaggcatc 360 
cttaccaagg aatctgcttt tcaagtatgc caccaacagt gaagaggtta ttggagtgat 420 
gagtaaagaa tacataccaa agggcacacg ttttggaccc ctaacaggtg aaatctacac 480 
caatgacaca gttcctaaga acgccaacag gaaatatttt tggaggatct attccagagg 540 
ggagcttcac cacttcattg acggctttaa tgaagagaaa agcaactgga tgcgctatgt 600 
gaatccagca cactctcccc gggagcaaaa cctggctgcg tgtcagaacg ggatgaacat 660 
ctacttctac accattaagc ccatccctgc caaccaggaa cttcttgtgt ggtattgtcg 720 
ggactttgca gaaaggcttc actaccctta tcccggagag ctgacaatga tgaatctcac 780 
acaaacacag agcagtctaa agcaaccgag cactgagaaa aatgaactct gcccaaagaa 840 
tgtcccaaag agagagtaca gcgtgaaaga aatcctaaaa ttggactcca acccctccaa 900 
aggaaaggac ctctaccgtt ctaacatttc acccctcaca tcagaaaagg acctcgatga 960 
ctttagaaga cgtgggagcc ccgaaatgcc cttctaccct cgggtcgttt accccatccg 1020 
ggcccctctg ccagaagact ttttgaaagc ttccctggcc tacgggatcg agagacccac 1080 
gtacatcact cgctccccca ttccatcctc caccactcca agcccctctg caagaagcag 1140 
ccccgaccaa agcctcaaga gctccagccc tcacagcagc cctgggaata cggtgtcccc 1200 
tgtgggcccc ggctctcaag agcaccggga ctcctacgct tacttgaacg cgtcctacgg 1260 
cacggaaggt ttgggctcct accctggcta cgcacccctg ccccacctcc cgccagcttt 1320 
catcccctcg tacaacgctc actaccccaa gttcctcttg cccccctacg gcatgaattg 1380 
taatggcctg agcgctgtga gcagcatgaa tggcatcaac aactttggcc tcttcccgag 1440 
gctgtgccct gtctacagca atctcctcgg tgggggcagc ctgccccacc ccatgctcaa 1500 
ccccacttct ctcccgagct cgctgccctc agatggagcc cggaggttgc tccagccgga 1560 
gcatcccagg gaggtgcttg tcccggcgcc ccacagtgcc ttctccttta ccggggccgc 1620 
cgccagcatg aaggacaagg cctgtagccc cacaagcggg tctcccacgg cgggaacagc 1680 
cgccacggca gaacatgtgg tgcagcccaa agctacctca gcagcgatgg cagcccccag 1740 
cagcgacgaa gccatgaatc tcattaaaaa caaaagaaac atgaccggct acaagaccct 1800 
tccctacccg ctgaagaagc agaacggcaa gatcaagtac gaatgcaacg tttgcgccaa 18 60 
gactttcggc cagctctcca atctgaaggt ccacctgaga gtgcacagtg gagaacggcc 1920 
tttcaaatgt cagacttgca acaagggctt tactcagctc gcccacctgc agaaacacta 1980 
cctggtacac acgggagaaa agccacatga atgccaggtc tgccacaaga gatttagcag 2040 
caccagcaat ctcaagaccc acctgcgact ccattctgga gagaaaccat accaatgcaa 2100 
ggtgtgccct gccaagttca cccagtttgt gcacctgaaa ctgcacaagc gtctgcacac 2160 
ccgggagcgg ccccacaagt gctcccagtg ccacaagaac tacatccatc tctgtagcct 2220 
caaggttcac ctgaaaggga actgcgctgc ggccccggcg cctgggctgc ccttggaaga 2280 
tctgacccga atcaatgaag aaatcgagaa gtttgacatc agtgacaatg ctgaccggct 2340 
cgaggacgtg gaggatgaca tcagtgtgat ctctgtagtg gagaaggaaa ttctggccgt 24 00 
ggtcagaaaa gagaaagaag aaactggcct gaaagtgtct ttgcaaagaa acatggggaa 24 60 
tggactcctc tcctcagggt gcagccttta tgagtcatca gatctacccc tcatgaagtt 2520 
gcctcccagc aacccactac ctctggtacc tgtaaaggtc aaacaagaaa cagttgaacc 2580 
aatggatcct taagattttc agaaaacact tattt 2615 



<210> 120 
<211> 29 
<212> PRT 

<213> Homo sapiens 
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<400> 120 

Leu Gin Asn Arg Arg Ala Leu Asp Leu Leu Thr Ala Giu Arg Gly Gly 
1 5 10 15 



Thr Cys Leu Phe Leu Gly Glu Glu Cys Cys Tyr Tyr Val 
20 25 



<210> 121 

<211> 21 

<212> ADN 

<213> Homo sapiens 

<400> 121 

cttcaaacaa caaccaggag g 21 



<210> 122 

<211> 20 

<212> ADN 

<213> Homo sapiens 



<400> 122 

ttggggaggt tggccgacga 



20 
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Nucleic acid fragments derived from HERV-7q env, diagnostic reagents, 
diagnostic applications and kits, peptides, pharmaceutical compositions and 
applications, antibodies and corresponding transgenic animals. 

2. Claims: 2-7, 10-20, 27-37 (all partly) 

Nucleic acid fragments derived from HERV-7q gag, diagnostic reagents, 
diagnostic applications and kits, peptides, pharmaceutical compositions and 
applications, antibodies and corresponding transgenic animals. 

3. Claims: 2-7, 10-20, 27-37 (all partly) 

Human nucleic acid fragments similar to HERV-7q gag, diagnostic reagents, 
diagnostic applications and kits, peptides, pharmaceutical compositions and 
applications, antibodies and corresponding transgenic animals. 

4. Claims: 24, 25 

Compositions comprising a CKS-type motif, inasmuch as said compositions do 
not contain a sequence as per the first invention. 
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INTERNATIONAL SEARCH REPORT 



International application No. 
PCT/FR 99/01513 



Continuation of Box 1.2 
Claim No: 8 



Claim 8 concerns a very wide variety of compounds. A support basis as defined 
in PCT Article 6 and a description as defined in PCT Article 5 can however be 
found for only a very limited number of the claimed compounds. In the present 
case, the claims are so lacking in support basis and the disclosure of the 
invention in the description is so limited that it is impossible to carry out any 
significant search concerning the whole claimed spectrum. 

The applicant's attention is drawn to the fact that claims concerning inventions 
in respect of which no search report has been established need not be the subject 
of a preliminary examination report (PCT Rule 66.1 (e)). The applicant is 
warned that the guideline adopted by the EPO acting in its capacity as 
International Preliminary Examining Authority is not to proceed with a 
preliminary examination of a subject matter unless a search has been carried out 
thereon. This position will remain unchanged, notwithstanding that the claims 
have or have not been modified, either after receiving the search report, or 
during any procedure under Chaper II. 
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RAPPORT DE RECHERCHE INTERNATIONALE 



Oem; Intemttloneitt No 

PCT/FR 99/01513 



A CLASSEMENT DE L'OBJET DE LA DEMAND £ 

CIB 6 C12N15/48 C12Q1/70 C07K14/15 A61K31/70 



Selon la classification intomattonaJe des brevets (ClB) ou a ta fois salon la classification nationale et ta CIB 



B. DOMAINES SUR LESQUELS LA RECHERCHE A PORTE 



Documentation minimale consultee (systems de classification suivi das symboles da classemenh 

CIB 6 C12N C12Q C07K A61K 



Documentation consult©* autre que la documentation minimale dans ta meeure ou cee documents relevant des domaines sur losquete a porta la recherche 



Base de donnees electronique consuttee au cours de la recherche Internationale {r>om de la base de donnees. et si realisable, termes de recherche utilises) 



C, DOCUMENTS CONSIDERES COMME PERTINENTS 



Categorle ° 



Identification des documents cites, avec, le cas echeant, I'lndlcation des passages pertinents 



no. des revendtcatlons viseea 



WO 98 23755 A (BIO MERIEUX) 

4 juin 1998 (1998-06-04) 

Comparez nucleotides 1-1462 de SEQ ID 

NO: 117 avec nucleotides 928-2390 de SEQ ID 

NO: 1 de la presente demande; comparez SEQ 

ID NO: 118 avec SEQ ID N0s:22 et 120 de la 

presente demande 

Database GenBank. Sequence HSAC 000064 
Clone humain BAC RG083M05 de 7q21-7q22, 
sequence complet. 17 novembre 1996. 
XP002118730 

Comparez nucleotides 28000-38500 d' 
AC00064 avec SEQ ID NO: 3 

-/- 



1,3-12, 
14-36 



1-4,13 



[T| V0ir ,a 80118 du Mdre C ,a " n de la lteto dea documents Las documents de families de brevets sont Indiques en annexe 



* Categories speciales de documents cites: 

"A" document defintesant Tetat general de la technique, non 
conskJdre comme particullerement pertinent 

"E" document anteneur, mais publtt a la date de depot international 
ou apres cette date 

V document pouvant Jetef un doute sur une revendlcaiion de 
priorite* ou cite pour determiner la date de publication d'une 
autre citation ou pour une raison special© (telle qu'lndiquee) 
'O" document se referartt a une divulgation orale, a un usage, a 
une exposition ou tous autres moyens 

'P" document public avant la date de depot international, mais 
poster) eurement a la date de priortte revendlquee 



T" document ulterieur public apres la date de depot international ou la 
date de priortte et n'appartenenant pas a I'etat de la 
technique pertinent, mais cite pour comprendre le principe 
ou la theorie constituant la base de ('invention 

"X" document particullerement pertinent; rinven tion revendlquee ne peut 
etre conskJerde comme nouvelle ou comme impliquant une activfte 
inventive par rapport au document consider ieolement 

"Y" document partlcullefement pertinent; rtnven tion revendlquee 
ne peut etre considdree comme impHquant une activity inventive 
lorsqua te document est asaocie a un ou plusieurs autres 
documents de meme nature, cette combinaison etant evtdente 
pour une personne du metier 



Date a laquelle la recherche internatlonale a et6 effectivement achevee 

18 octobre 1999 


Date d" expedition du present rapport de recherche Internationale 

11 tL 99 


Nom et adresee poetale de ('administration charge© de la recherche Internationale 
Office europeen des Brevets, P.B. 5818 Patentlaan2 
NL-2280 HV Rlfsw^K 
Tel. (+31-70) 340-2040, Tx. 31 651 epo nl, 
Fax: (+31-70) 340-3016 


Foncttonnare autorise 

Cupldo, li 
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RAPPORT DE RECHERCHE INTERNATIONALE 



Oenu IntemaAlonat* No 

PCT/FR 99/01513 



C.(aufte) DOCUMENTS CONSIDERES COMME PERTINENTS 



Categorie 0 Identification des docunientt cites, avec, to cat echeant, I'lndlcationdes passage* pertinent* 



no. oe a revindications visees 



P.X 



P,X 



P,X 



ALLIEL PM ET AL: "Sequences retrovirales 

endogenes anlogues a celle du nouveau 

retrovirus MSRV associe a la sclerose en 

plaques ( premiere partie)" 

COMPTES RENOUS OES SEANCES DE L'ACADEMIE 

DES SCIENCES SERIE III: SCIENCES DE LA 

VIE., 

vol. 321, no. 6, ju1n 1998 (1998-06), 
pages 495-499, XP002101380 
MONTREUIL FR 
figures 2,3 

Database GenBank Sequence AC X93499 
mRNA de H. sapiens pour la proteine rab7 
10 fevrler 1997 
XP002119234 

6 VITELLI R ET AL: "Molecular cloning and 
expression analysis of the human rab7 
GTP-ase complementary deoxyribonucleic 
add" 

BIOCHEMICAL AND BIOPHYSICAL RESEARCH 
COMMUNICATIONS, 

vol. 229, no. 3, 1996, pages 887-890, 
ORLANDO, FL US 

FR 2 737 500 A (BIO MERIEUX) 

7 fevrier 1997 (1997-02-07) 
cite dans la demande 

le document en entier 

WO 99 02666 A (BIO MERIEUX) 

21 janvier 1999 (1999-01-21) 

Comparez SEQ ID NOs 130, 117, 114 et 120 

avec SEQ ID NOs: 1-3 de cette demande et 

SEQ ID NO: 118 avec SEQ ID NOs : 22 et 120 de 

cette demande 

WO 99 02696 A (BIO MERIEUX ; BESEME 
FREDERIC (FR); BLOND JEAN LUC (FR); BOUTON 
OLD 21 janvier 1999 (1999-01-21) 
Comparez SEQ ID NOs: 4, 5, 7, 9 et 11 avec 
SEQ ID NOs: 1-3 de cette demande. 

ALLIEL PM ET AL: "Retrovirus endogenes et 
sclerose en plaques. II. HERV-7q" 
COMPTES RENDUS DES SEANCES DE L'ACADEMIE 
DES SCIENCES SERIE III: SCIENCES DE LA 
VIE., 

vol. 321, no. 10, octobre 1998 (1998-10), 

pages 857-863, XP002101381 

MONTREUIL FR 

le document en entier 

-/-- 



1,3-12, 
14-36 



1-4 



1,3-12, 
14-36 



1,3-12, 
14-36 



1,3-12, 
14-36 



1,3-12, 
14-36 



ForrmMn PCT/ISAtt10(sut* 4* It dwudtme leuU) (juJI« 1903) 
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Dema Internationale No 



PCT/FR 99/01513 



C.(sulte) DOCUMENTS CONSIDERES COMME PERTINENTS 


Categorie 


3 Identification de* documents cites, avee.le cas echeant. I'lndlcatlondes passages pertinents 


no. das revendtcations viseea 


P,X 


WO 99 26972 A (GENETICS INSTITUTE, INC.) 
3 ju1n 1999 (1999-06-03) 
comparez SEQ ID N0:4 avec a. a. 131-668 de 
sequence 22 de cette demande 


1-4 


A 


MITANI M ET AL: "Suppressive effect on 
polyclonal B-cell activation of a 
synthetic peptide homologous to a 
transmembrane component of oncogenic 
retrovirus" 

PROCEEDINGS OF THE NATIONAL ACADEMY OF 
SCIENCES OF USA, 

vol. 84, no. 1, Janvier 1987 (1987-01), 
pages 237-240, XP002118729 
WASHINGTON US 
cite dans la demande 
le document en entier 


24,25 



FoonJalrt PCT/ISA/210 (tJto da ta datubam* (wiS«) QuiM 1992} 
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RAPPORT DE RECHERCHE INTERNATIONALE 



C ande intemationaie n 9 

PCT/FR 99/01513 



Conformemerrt a 1'artide I7.2)a), oertames revendications n'ont pas fait robjet tfune reoherohe pour las motifs survants: 

1. I | Lea revendications n M 

se rappofterrt a un objet & regard duquel ('administration n'est pas tenue de proceder a la recherche, a aavoir 



2. 2] Les revendicationa n°* 8 

so rapportent 4 des parties de la demands intemationaie qui no remptissent paa surftsammerrt lea conditions present es pour 
qu une recherche significative puiase etre effectuee, en particulier: ^ ^ 

voir feuille supplemental re SUITE DES RENSEIGNEMENTS PCT/ISA/210 



3. Las revendications n oa 

sont des revendicabons dependants* et ne aont paa recfigees conformement aux dispositions de la deuxieme et de la 
traisieme phrases de la regie 6. 4.a). 



Cadre II Observation. • lorsqu'll y a absence d'untte de llnventlon (suite du point 2 de la premiere feuille) 



[.'administration chargee de la recherche intemationaie a trouve ptuaieurs inventions dans la demande intemationaie, a savoir: 

voir feuille supplemental re 



1 ' [Z] w t0U ! M le ! taXeS additionnellea orrt «*« Paywa dans lea delais par le deposant, le present rapport de recherche 
— intern ationale porte sur toutes les revendications pouvant fairs I'objet d'une recherche. 

2 ' ^ SiZl ™7» ^TZH- '"J ,9 . 9 reV ? ndi< ? ti ?' 1 ? qui aV pr4taient ont P u dtr * sans effort particulie 

juatiftant una taxe additionneile, I'administrahon n'a soflicrte le paiemertt d'aueune taxe de cette nature 



3. I"] Comme unfl partie seulement des taxes additionnellea demandees a ete payee dans In delais par le deposant le present 
XeZLt^TX^ 1 ^ ^ SUt ,M reVOndCa ^ 8 Pour l^uelles tes taxes'o^K, * EST 



4. □ Aucune taxe additionneile demands, n'a ete payee dans Iss delais par le deposant En consequence, le present rapport 

,,inVenti0n ™ ntionn6e P^niier lieu dans les revendications; elle est 



Remarque quant a la reserve Q 198 taxea «ldft«nneltes etaient aocompagnees d'une reserve de la part du deposan 

| | L 8 paiement des taxes addrtionndles n'etait assortt d'aucune reserve. 
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_ Demands internationals Mo. PCT/FR 99/G1513 

SUITE DES RENSEIGNEMENTS INDIQUES SUR PCT/I8A/ 210 



Suite du cadre 1.2 
Revendi cations nos.: 8 

Le revendication 8 presente a trait a une tres grande variete de 
composes. Un fondement au sens de I 'Article 6 PCT et un expose au sens de 
i Article 5 PCT ne peut cependant Stre trouve que pour un nombre tres 
restreint de ces composes revendiques. Dans le cas present, les 
reyendications manquent a un tel point de fondement et 1 'expose de 
l invention dans la description est si limite q'une recherche 
significative couvrant tout le spectre revendique est impossible. 

L'attention du deposant est attiree sur le fait que les revendi cat ions, 
ou des parties de revendi cations, ayant trait aux inventions pour 
lesquelles aucun rapport de recherche n'a ete etabli ne peuvent faire 
obligatoirement I'objet d'un rapport preliminaire d'examen (Regie 66.1(e) 
PCT). Le deposant est averti que la ligne de conduite adoptee par I'OEB 
agissant en qualite d 'administration chargee de I'examen preliminaire 
international est, normalement, de ne pas proceder a un examen 
preliminaire sur un sujet n'ayant pas fait I'objet d'une recherche. Cette 
attitude restera inchangee, i ndependamnent du fait que les revendi cations 
aient ou n aient pas ete modifiees, soit apres la reception du rapport de 
recherche, soit pendant une quelconque procedure sous le Chapitre II 



Demande m tarnation a* No. PCT/FR 99/G1513 



SUrTE DES RENSEIGNEMENTS INOIQUES SUR PCT/ISA/ 21Q 



[.'administration chargee de la recherche international a trouv§ 
plusieurs (groupes d') inventions dans la demande international^ a 
savoir: 



1- revendications: 1, 9, 21-23, 26 (complet), 28, 
10-20 et 27-37 (partiellement) 



Fragments d'acide nucleique derive du HERV-7q env, reactifs 
de diagnostic, applications et kits diagnostiques, peptides 
compositions et applications pharmaceutiques, anticorps et * 
animaux transgeniques correspondants. 

2. revendications: 2-7, 19-29, 27-37( tous partiellement) 

Fragments d'acide nucleique derive du HERV-7q gag, reactifs 
de diagnostic, applications et kits diagnostiques, peptides, 
compositions et applications pharmaceutiques, anticorps et 
ammaux transgeniques correspondants. 

3. revendications: 2-7, 19-29, 27-37( tous partiellement) 

Fragments d'acide nucleique humaines similaires a HERV-7a 
(SEQ ID NOs: 4-21 et 61), reactifs de diagnostic, 
applications et kits diagnostiques, peptides, compositions 
et applications pharmaceutiques, anticorps et animaux 
transgeniques correspondants. 

4. revendications: 24, 25 

Compositions comprenant un motif de type CKS, dans la mesure 
ou ces compositions ne contiennent pas une sequence selon la 
premiere invention. 
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